• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар НУГ №7: Дмитрий Фролов

Агрегированное представление текстов для задач поиска в коллекциях текстовых документов

Аннотация: В докладе будет представлена тема, ставшая предметом диссертационного исследования Д.С. Фролова под руководством Ординарного профессора Б.Г. Миркина. Использование агрегированного представления текстов в задачах информационного поиска является одним из новейших направлений исследований в этой области. В диссертационном исследовании изучается возможность применения представления текстов с помощью аннотированных суффиксных деревьев в направлении повышения производительности и разведочного поиска (интерпретируемости коллекций). В первом направлении разработан и экспериментально обоснован метод информационного поиска АСДП, комбинирующий преимущества представления текстов аннотированными суффиксными деревьями и обратного фрагментного индексирования. Во втором направлении предложены и успешно применены методики использования таксономии предметной области: разведочный поиск путем структурирования и интерпретации коллекции текстов и эффективное расширение аудитории интернет-рекламы. Обе методики основаны на новой разработке - методе оптимального обобщения в таксономиях (ПарГеНМ), причем во втором случае эффект обобщения допускает количественную оценку.