Центр искусственного интеллекта НИУ ВШЭ

Рекомендательный сервис для автоматизации аналитических процессов научно-технической деятельности

Целью проекта является преодоление имеющихся ограничений в информационной поддержке субъектов научно-технической деятельности за счет создания первого полностью отечественного решения для предоставления сервисов научной аналитики на основе интеллектуальных технологий сбора и обработки полнотекстовых научно-технических данных на русском и английском языках. Пользователями сервисов создаваемой рекомендательной системы будут научные работники, инженеры, специалисты по интеллектуальной собственности, эксперты и аналитики, а основной эффект от выпуска системы в публичный доступ будет заключаться в уменьшении временных издержек и повышении полноты и доступности информации о состоянии мировой науки и технологий при принятии решений, выборе направлений исследований, подготовке аналитических исследований и обзоров, подготовке научных и технических текстов.

Специфика научных исследований в России требует наличия инструментов согласованного анализа научно-технических документов на русском и английском языках. Однако в настоящее время такие инструменты и технологии отсутствуют на российском и мировом рынках. По этой причине повседневные задачи научных работников, исследователей, инженеров и других субъектов научно-технической деятельности сопряжены с использованием ряда зарубежных инструментов (WoS, Scopus, InCites, SciVal, Dimensions, Orbit, PatentSight, Google Scholar и других), не покрывающих информацию на русском языке, вкупе с отечественными (РИНЦ, база Роспатента) для получения картины о ситуации в России и в мире. При этом указанные базы имеют ограниченные аналитические инструменты, а технологии ИИ в них не применяются. Вместе с тем ряд процессов научной и инженерной деятельности могут быть автоматизированы.

Особенность проекта заключается в выборе и промышленной реализации технологий искусственного интеллекта для автоматизации следующих процессов научно-технической деятельности:

1.   Поиск релевантных документов (статей, патентов, отчетов и др.) на русском и английском языках по области интересов пользователя, заданной через поисковые запросы, расчет количественных индикаторов на основе содержащихся в них лингвистических данных и построение наборов стандартизованных визуально-аналитических материалов, отражающих тематический контент документов;

2.   Выявление и анализ научно-технологических и близких к ним семантических понятий, количественных экспертных утверждений об их параметрах и численных статистических метрик характеризующей их лексики;

3.   Эксплоративный поиск и оценка трендов, технологий, продуктов, рынков по области интересов пользователя, заданной через поисковые запросы;

4.   Обнаружение и оценка центров компетенций (ведущих организаций и специалистов) по области интересов пользователя, заданной через поисковые запросы;

5.   Оценка уровня представленности научно-технологических тенденций в документах, характеризующей различные стадии возникновения и развития технологий и рынков, а также сопоставление российской и глобальной повесток.

Основным научным и инженерным вызовом проекта является масштабирование передовых технологий искусственного интеллекта, апробированных на ограниченных массивах данных в экспериментальных условиях, на интеллектуальную рекомендательную систему, функционирующую в виде промышленного решения, востребованную российским научным и инженерным сообществом.

Проект реализуется совместно со Сбером.