В Центре ИИ изучаются механизмы работы LLM, создаются инструменты для генерации реалистичного контента и проектирования виртуальных сред. Также реализуются мультимодальные подходы, объединяющие язык и визуализацию для решения научных и прикладных задач. Специалисты занимаются ускорением моделей за счет эффективного переноса знаний и аугментируют LLM возможностями интеграции с внешними инструментами и базами данных, увеличивая автономность и аналитический потенциал ИИ.
Разработка новых алгоритмов обучения, дообучения и ускорения фундаментальных и генеративных моделей
Задачи
-
Разработка эффективных алгоритмов дообучения генеративных моделей различного типа (GAN, диффузионные модели, LLM) с использованием малопараметрических матричных представлений
-
Создание новых тензорных алгоритмов для аппроксимации параметров моделей и методы регуляризации, учитывающие разреженность, низкоранговую структуру и архитектурные особенности генеративных моделей, что позволит ускорить дообучение, предотвратить переобучение и повысить качество генерации
-
Разработка продвинутых методов регуляризации и исследование способов объединения дообученных моделей в контексте непрерывного обучения и персонализированной генерации
Создание модели генеративного искусственного интеллекта c использованием омиксных данных
Задачи
-
Создание модели генеративного искусственного интеллекта на основе омиксных данных
-
Разработка методов xAI (explainable AI — интерпретируемый ИИ) для интерпретации значимости омиксных признаков для моделей глубокого обучения и фундаментальных моделей
-
Разработка методов генерации ФЭГ (функциональных элементов генома) и омиксных признаков
Эффекты
-
Снижение рисков ошибочно принятых решений в генетической диагностике
-
Снижение трудоемкости автоматизации молекулярно-генетических исследований за счет реализации интеллектуальных компонент анализа данных и машинного обучения
-
Повышение эффективности работы с большими данными молекулярной биологии за счет комбинирования традиционного моделирования, методов оптимизации и искусственного интеллекта, что позволит получить наилучшие результаты, опирающиеся как на теорию предметной области, так и на результаты обработки данных
-
Повышение доступности искусственного интеллекта в целях его использования для персонализированной диагностики, раннего детектирования генетических заболеваний, а также развития прикладных научных исследований в области биоинформатики
ИИ и кардиогенетика
Задачи
-
Разработка алгоритмов и математических моделей в области молекулярной биологии, генетики и биоинформатики с целью повышения точности и эффективности анализа геномных данных для PA GE 16 16 изучения сердечно-сосудистых заболеваний
-
Создание инструментов для персонализированной медицины на основе фундаментальных моделей, позволяющих оценивать риск развития сердечно-сосудистых заболеваний, инфаркта миокарда и внезапной смерти
Моделирование нейрокогнитивного здоровья на основе речи и структурных характеристик мозга
Задачи
-
Разработка модели для выявления постинсультной афазии по спонтанной речи, моделей для выявления для выявления возрастного когнитивного снижения по спонтанной речи, в том числе на основе методов глубокого обучения и больших языковых моделей
Эффекты
-
Снижение рисков ошибочно принятых решений в нейрокогнитивной диагностике: нарушений речи, чтения, когнитивного снижения;
-
Снижение трудоемкости диагностики за счет реализации интеллектуальных компонент анализа данных и машинного обучения
Создание адаптированной LLM для сферы науки, технологий и инноваций
Задачи
-
Проведение экспериментов по дообучению open-source больших языковых моделей (LLM) с целью их адаптации к решению задач в области науки, технологий и инноваций
-
Разработка способов реализации больших языковых моделей на ограниченных вычислительных ресурсах, а именно — исследование и выбор методов ускорения (оптимизации) вычислений
-
Исследование подходов к обучению мультимодальных LLM, учитывающих при генерации ответов взаимосвязи и структуру документов — анализ дополнительных модальностей позволяет моделям более полно понимать контекст пользовательских запросов
-
Разработка оптимального решения для улучшения генерации ответов в сфере науки, технологий и инноваций
-
Выбор и реализация оптимальных reasoning-методов для работы с научнотехническими данными и внедрение выбранного решения в мультиагентную архитектуру
Практические результаты
-
Инновационное программное решение для анализа информации о НИОКР с помощью технологий искусственного интеллекта, применимое в домене «Наука и инновации» для комплексного исследования трендов российской науки и определения центров компетенций, обладающих потенциалом реализации задач национальных проектов технологического лидерства
Эффекты
-
Сокращение объема вычислительных ресурсов, требующихся для использования LLM в задачах поиска, синтеза и анализа данных, возможно с помощью эффективных методов дистилляции и квантизации
-
Применение адаптированной LLM с наилучшими параметрами качества для решения задач научно-технологической и тренд-аналитики на основе обработки документов по научным и техническим тематикам
Дообучение LLM для системы рекомендации карьерных и образовательных траекторий абитуриентов
Эффекты
-
Модель будет способна анализировать интересы абитуриента, задаваемые в свободной форме, его характеристики, а также предсказания заработной платы, полученные с применением моделей машинного обучения, и на их основе формировать рекомендации по выбору образовательной траектории и дальнейшей карьеры
Инновационное программное решение для предпринимателей на основе дообученной большой языковой модели
Эффекты
-
Повышение осведомленности предпринимателей о государственной поддержке
-
Обеспечение качественной навигации по мерам государственной поддержки
-
Стимулирование проактивного поведения предпринимателей
-
Сокращение времени обработки запросов в центрах поддержки малого и среднего предпринимательства(МСП)
-
Повышение качества принимаемых решений и снизит нагрузку на специалистов служб поддержки МСП
Мультимодальные визуально-текстовые модели ИИ
Задачи
-
Создание программной библиотеки для построения систем комплексной обработки разнородных данных для задач промышленности, медицины и бизнеса, что позволит упростить применение больших фундаментальных моделей в инновационных программных решениях искусственного интеллекта
-
Разработка генеративных моделей, адаптированных под специфические домены
Эмпатичный ИИ: мультимодальная модель для предсказания эмоциональных состояний человека
Задачи
Разработка математического и программного обеспечения, позволяющего анализировать и интерпретировать эмоциональные состояния и персональные характеристики человека на основе мультимодальных данных, включая:
- методы автоматического распознавания эмоций
- оценку личностных качеств
- создание цифровых эмоционально выразительных аватаров
- разработку интерфейсов, адаптирующихся к эмоциональному состоянию пользователя
Практические результаты
-
Создание высокоточных нейросетевых моделей распознавания и интерпретации эмоций
-
Разработка генеративных нейросетевых моделей создания цифровых эмоционально выразительных аватаров и интеллектуальных мультимодальных интерфейсов для улучшения взаимодействия с пользователем в различных областях