Центр искусственного интеллекта НИУ ВШЭ

Индекс этичности компаний

Цель проекта

Разработка инструментария, позволяющего оценить этическую репутацию российских компаний на основе машинного анализа открытых текстовых данных из различных источников: новостные ленты, веб-сайты компаний, социальные сети, годовые и нефинансовые отчеты компаний.

Используемые методы:

 

  • Программные средства веб-скрейпинга (web-scraping)

    Данная технология позволяет с помощью программного кода автоматически преобразовывать HTML-страницы в более удобный для последующего анализа формат данных.

  • Методы обработки естественного языка (NLP – natural language processing)

    Методы NLP применяются для дальнейшего процессинга текстовых данных. Данные методы активно развиваются и используются с середины прошлого века в различных областях, таких как медицина, финансы, образование, а также в бизнесе. Однако до сих пор потенциал применения методов NLP для оценки этичности компаний и их лидеров полностью не реализован.

  • Анализ тональности (sentiment analysis) текстов, содержащих упоминание компании

    Данный метод позволяет оценить эмоциональную окраску используемой в тексте лексики, а также выявить эмоциональную оценку автора текста по отношению к описываемому объекту.

  • Модели глубинного обучения

    Модели глубинного обучения будут применяться для анализа текстовых отзывов потребителей на услуги российских компаний.

Команда проекта

Сторчевой Максим Анатольевич

Руководитель проекта

Гоголев Степан Леонидович

Стажер-исследователь

Паклина София Николаевна

Младший научный сотрудник