Разберемся, что нового в претрейне LLM в 2025
Влад Савинов из команды предварительного обучения YandexGPT расскажет об актуальном: о запуске обучения FP8 на моделях с параметрами 600B, работе новых оптимизаторов, таких как Muon, и их конкуренции с AdamW, а также о практических улучшениях в эффективности обучения и разработке MoE.
Поговорим про Creative AI
Вместе с Александром Барановым с факультета компьютерных наук Вышки сделаем обзор Creative AI как области, где креативность понимается шире, чем генерация изображений и музыки. Подробнее рассмотрим актуальные направления вычислительного юмора: детекцию, генерацию и интерпретацию.
Узнаем о быстрой и точной диаризации речи
Она позволяет автоматически определить, кто и в какой момент говорит в аудиозаписи. Эта технология активно используется в системах распознавания речи, онлайн-встречах и других приложениях, где важно быстро и точно обрабатывать записи с участием нескольких спикеров.
Наш проводник — Виктория Погосян из Российско-Армянского университета.
Разберемся в денойзинге и усилении речи
Причем в условиях аудиопотока и низких вычислительных мощностей.
Основной запрос на задачу усиления речи приходит от производителей смартфонов и других умных устройств, где есть сильные ограничения по сложности используемых алгоритмов: не все влезает в память и считается быстро. А еще сложность влияет на энергопотребление. Помимо сложности, часто хотят, чтобы алгоритм мог работать в аудиопотоке в режиме реального времени.
Максим Каледин с факультета компьютерных наук НИУ ВШЭ расскажет про недавнее разработанное решение, а также про интересные направления развития.
Погрузимся в распознавание эмоций в речи
Современные алгоритмы не просто слышат слова — они улавливают изменения в голосе, чтобы распознать радость, грусть и другие эмоции. Технологии распознавания эмоций открывают путь к более эмпатичным машинам. О гибридном подходе распознавания речи на основе синхронизации аудио и текста расскажет Шагане Тигранян из Российско-Армянского университета.
Приглашаем на AI митап: встречаемся 14 ноября в Ереване или онлайн. Спикерами станут исследователи факультета компьютерных наук Вышки, Яндекса и Российско-Армянского университета.
Поговорим о креативности искусственного интеллекта, денойзинге и усилении речи, предобучении LLM, а также про диаризацию речи и распознавание эмоций в ней.
Организаторы митапа: факультет компьютерных наукн НИУ ВШЭ, Яндекс и Российско-Армянский университет.
Локация: Российско-Армянский университет, ул. Овсепа Эмина, 123, Ереван, 0051, Армения. Аудитория имени Орбели (Новый корпус РАУ, 7 этаж).
Онлайн-трансляция — в группе факультета компьютерных наук НИУ ВШЭ в ВК.
Участие
Бесплатное, по предварительной регистрации.
Спикеры
Аспирант, стажер-исследователь ФКН НИУ ВШЭ
Исследователь Центра передовых программных технологий РАУ
Руководитель команды инфраструктуры обучения YandexGPT, Яндекс
Доцент, научный сотрудник ФКН НИУ ВШЭ
Исследователь Центра передовых программных технологий РАУ
-
Программа (GMT+4)
10:30–11:00, Сбор гостей
11:00–11:50, Доклад №1
11:50–12:00, перерыв
12:00–12:50, Доклад №2
12:50–13:00, перерыв
13:00–13:50, Доклад №3
13:50–14:00, перерыв
14:00–14:50, Доклад №4
14:50–15:00, перерыв
15:00–15:50, Доклад №5
Контакты организаторов
Директор Института математики, физики и высоких технологий РАУ, к.т.н., доцент
Менеджер по международной деятельности ФКН НИУ ВШЭ
international@rau.am, (374) 12 26 00 15
Event-менеджер ФКН НИУ ВШЭ