Центр искусственного интеллекта НИУ ВШЭ

Индекс этичности компаний

Цель проекта

Разработка инструментария, позволяющего оценить этическую репутацию российских компаний на основе машинного анализа открытых текстовых данных из различных источников: новостные ленты, веб-сайты компаний, социальные сети, годовые и нефинансовые отчеты компаний.

Используемые методы:

 

  • Программные средства веб-скрейпинга (web-scraping)

    Данная технология позволяет с помощью программного кода автоматически преобразовывать HTML-страницы в более удобный для последующего анализа формат данных.

  • Методы обработки естественного языка (NLP – natural language processing)

    Методы NLP применяются для дальнейшего процессинга текстовых данных. Данные методы активно развиваются и используются с середины прошлого века в различных областях, таких как медицина, финансы, образование, а также в бизнесе. Однако до сих пор потенциал применения методов NLP для оценки этичности компаний и их лидеров полностью не реализован.

  • Анализ тональности (sentiment analysis) текстов, содержащих упоминание компании

    Данный метод позволяет оценить эмоциональную окраску используемой в тексте лексики, а также выявить эмоциональную оценку автора текста по отношению к описываемому объекту.

  • Модели глубинного обучения

    Модели глубинного обучения будут применяться для анализа текстовых отзывов потребителей на услуги российских компаний.

Команда проекта

Сторчевой Максим Анатольевич

Руководитель проекта

Тарасов Александр Михайлович

Отдел организации научной деятельности: Начальник отдела

Лапина Вера Владимировна

Стажер-исследователь

Тарасов Егор Александрович

Стажер-исследователь