Семинар BayesLab «Смузи: сглаживающая диффузия на эмбеддингах токенов для генерации текста»
Александр Шабалин расскажет о методе Smoothie, объединяющим два основных подхода построения непрерывной текстовой диффузии
Во вторник, 22 июля 2025 г. в 18:00 Александр Шабалин, аспирант Департамента больших данных и информационного поиска ФКН НИУ ВШЭ, выступит с докладом «Смузи: сглаживающая диффузия на эмбеддингах токенов для генерации текста», посвящённым методу Smoothie, в котором объединяются два основных подхода построения непрерывной текстовой диффузии.
Чаще всего для построения непрерывной текстовой диффузии используется латентное пространство эмбеддингов токенов, которое впоследствии зашумляется с помощью добавления Гауссовского шума. Такой подход имеет важное ограничение – он никак не использует дискретность домена текстов. Альтернативой является замена эмбеддингов токенов на их one-hot векторы. В таком случае в процессе генерации модель восстанавливает конкретные токены, эксплуатируя их дискретность. Однако при этом начинает игнорироваться отношение близости между токенами.
В нашей работе мы представляем Smoothie – метод текстовой диффузии, объединяющий эти два подхода. Метод представляет каждый токен в виде вектора его семантических расстояний до других токенов. В процессе зашумления расстояния постепенно сглаживаются, делая неразличимыми сначала прохожие токены, а в конце – совсем не похожие. Данный подход стабильно повышает качество генерации текста как для условной, так и для безусловной генерации.
Выступление пройдёт в аудитории 207 корпуса R НИУ ВШЭ (Покровский бульвар, д. 11) с возможностью онлайн-участия в Zoom. Начало состоится в 18:00 по Московскому времени.