Центр искусственного интеллекта НИУ ВШЭ

Индекс этичности компаний

В рамках проекта разрабатывается инструментарий, позволяющий оценить этическую репутацию российских компаний на основе машинного анализа открытых текстовых данных из различных источников: новостные ленты, веб-сайты компаний, социальные сети, годовые и нефинансовые отчеты компаний.

Для разработки этого инструмента используются методы, которые сами по себе не являются новыми, однако еще не применялись для оценки этичности компании. Существуют попытки оценивать на основе ИИ внутреннюю переписку в организации на предмет выявления признаков мошенничества или оценки организационной культуры. Применение и адаптация данных методов к этической области и представляют собой научную новизну.

Инструментарий разрабатывается на основе обширной базы данных текстовой информации, опубликованной в различных интернет-источниках. Для того чтобы собрать достаточный для анализа корпус текстов, в которых упоминается компания, будут использованы программные средства веб-скрейпинга (web-scraping). Данная технология позволяет с помощью программного кода автоматически преобразовывать HTML-страницы в более удобный для последующего анализа формат данных. Дальнейший процессинг текстовых данных осуществляется с помощью методов обработки естественного языка (NLP – natural language processing). Методы NLP активно развиваются и используются с середины прошлого века в различных областях, таких как медицина, финансы, образование, а также в бизнесе. Однако до сих пор потенциал применения методов NLP для оценки этичности компаний и их лидеров полностью не реализован.

Одна из подзадач проекта – анализ тональности (sentiment analysis) текстов, содержащих упоминание компании, позволяющий оценить частоту использования слов с положительной и отрицательной эмоциональной окраской. Данный метод позволяет оценить эмоциональную окраску используемой в тексте лексики, а также выявить эмоциональную оценку автора текста по отношению к описываемому объекту.

Также особое внимание будет уделено оценке этичности российских компаний на основе текстовых отзывов потребителей на их услуги и с помощью моделей глубинного обучения.

Команда проекта

Сторчевой Максим Анатольевич

Руководитель проекта

Гоголев Степан Леонидович

Стажер-исследователь

Паклина София Николаевна

Младший научный сотрудник