• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар НУГ №6: А.С. Власов

Мероприятие завершено

Шестое заседание НУГ "Концепт" состоится 29 мая. Докладчик: А.С. Власов. Тема: "Метод обобщения в таксономиях и его применение"

Аннотация:

В работе рассматривается недавно предложенный в группе Б.Г. Миркина метод "наиболее экономного" обобщения в таксономиях. Предлагается модификация метода, использующая критерий максимального правдоподобия. Метод применяется для анализа структуры массива 26000 журнальных публикаций в области Науки о данных за последние 20 лет с использованием имеющейся таксономии Науки о данных. Метод аннотированного суффиксного дерева применяется для формирования коэффициентов релевантности между публикациями и ключевыми словами (терминальными темами таксономии). По этой информации формируются нечеткие кластеры ключевых слов, которые затем обобщаются с использованием разработанного матобеспечения. Вычисление вероятностей возникновения и потери смыслов в вершинах таксономии производится на основе результатов, полученных на 20% случайных подмножествах публикаций. Результаты вычислений свидетельствуют о том, что критерии наибольшей экономии и максимального правдоподобия совместимы.
Полученные кластеры и их обобщения в целом подтверждают сделанные ранее выводы (на основе массива 18000 статей), но значительно их детализируют.