Научно-учебная группа завершила свою работу.
НУГ «Методы анализа и визуализации веб-корпусов» приветствует Вас!
Мы разрабатываем подход, который исходит из заданных: (а) коллекции текстов Т и (б) совокупности интересующих пользователя словосочетаний С. В результате обработки на выходе должны быть отображены интересные характеристики использования данных словосочетаний в текстах данной коллекции. Обычно это делается путём так называемого контент-анализа. Контент-анализ выявляет и показывает такие словосочетания, которые в данной коллекции используются необычным образом: либо значительно чаще, либо значительно реже, чем в среднем. Пользователь видит эти необычные «знаки» и интерпретирует их в соответствии со своим пониманием явления, представляемого данной коллекцией текстов.