• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Семинар BayesLab «Смузи: сглаживающая диффузия на эмбеддингах токенов для генерации текста»

16+

Александр Шабалин расскажет о методе Smoothie, объединяющим два основных подхода построения непрерывной текстовой диффузии

Во вторник, 22 июля 2025 г. в 18:00 Александр Шабалин, аспирант Департамента больших данных и информационного поиска ФКН НИУ ВШЭ, выступит с докладом «Смузи: сглаживающая диффузия на эмбеддингах токенов для генерации текста», посвящённым методу Smoothie, в котором объединяются два основных подхода построения непрерывной текстовой диффузии.

Чаще всего для построения непрерывной текстовой диффузии используется латентное пространство эмбеддингов токенов, которое впоследствии зашумляется с помощью добавления Гауссовского шума. Такой подход имеет важное ограничение – он никак не использует дискретность домена текстов. Альтернативой является замена эмбеддингов токенов на их one-hot векторы. В таком случае в процессе генерации модель восстанавливает конкретные токены, эксплуатируя их дискретность. Однако при этом начинает игнорироваться отношение близости между токенами.

В нашей работе мы представляем Smoothie – метод текстовой диффузии, объединяющий эти два подхода. Метод представляет каждый токен в виде вектора его семантических расстояний до других токенов. В процессе зашумления расстояния постепенно сглаживаются, делая неразличимыми сначала прохожие токены, а в конце – совсем не похожие. Данный подход стабильно повышает качество генерации текста как для условной, так и для безусловной генерации.

 

Выступление пройдёт в аудитории 207 корпуса R НИУ ВШЭ (Покровский бульвар, д. 11) с возможностью онлайн-участия в Zoom. Начало состоится в 18:00 по Московскому времени.


 

Zoom

Добавить в календарь