Исследование подобластей в семантическом пространстве естественного языка, связаных с описанием глубинных психологических процессов
Выполнил: Мазаев Илья Александрович
Исследование заключается в применении современных методов анализа естественного языка для выделения наиболее важных признаков и закономерностей в тексте, которые в будущем могут быть использованы для разработки уникального алгоритма обнаружения и классификации архетипов личности в литературном тексте или речи человека. Для представления слов в семантическом пространстве рассматриваются их векторные представления - эмбеддинги, например, полученные с использованием сингулярного разложения (TF-IDF + SVD) и CBOW. Для построения изображения семантического пространства языка использовался метод визуализации t-SNE. В целях объективного анализа пространства языка и поиска подобластей пространства, относящихся к архетипам, применён алгоритм кластеризации Уишарта. Для оценки качества кластеризации используются внутренние метрики качества кластеризации.
Итоговый отчет
Ссылка на репозиторий на GitHub
Руководитель проекта
Департамент анализа данных и искусственного интеллекта: Профессор
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.