Индекс этичности компаний
Цель проекта
Разработка инструментария, позволяющего оценить этическую репутацию российских компаний на основе машинного анализа открытых текстовых данных из различных источников: новостные ленты, веб-сайты компаний, социальные сети, годовые и нефинансовые отчеты компаний.
Используемые методы:
-
Программные средства веб-скрейпинга (web-scraping)
Данная технология позволяет с помощью программного кода автоматически преобразовывать HTML-страницы в более удобный для последующего анализа формат данных.
-
Методы обработки естественного языка (NLP – natural language processing)
Методы NLP применяются для дальнейшего процессинга текстовых данных. Данные методы активно развиваются и используются с середины прошлого века в различных областях, таких как медицина, финансы, образование, а также в бизнесе. Однако до сих пор потенциал применения методов NLP для оценки этичности компаний и их лидеров полностью не реализован.
-
Анализ тональности (sentiment analysis) текстов, содержащих упоминание компании
Данный метод позволяет оценить эмоциональную окраску используемой в тексте лексики, а также выявить эмоциональную оценку автора текста по отношению к описываемому объекту.
-
Модели глубинного обучения
Модели глубинного обучения будут применяться для анализа текстовых отзывов потребителей на услуги российских компаний.
Команда проекта
Руководитель проекта
Отдел организации научной деятельности: Начальник отдела
Стажер-исследователь
Стажер-исследователь