Спецсеминар Bayes Group: Monolingual and Cross-lingual Text Detoxification
17 марта состоится спецсеминар, начало в 18 00.
Выступит: Александр Панченко (Associate Professor, Skoltech, NLP Lab, AI Center)
Тема: Monolingual and Cross-lingual Text Detoxification
Абстракт: В этом докладе мы рассмотрим задачу переноса текстового стиля на примере задачи детоксикации текста. В первой части доклада мы рассмотрим моноязычный эксперимент сбора параллельных данных для задачи детоксикации. Мы собираем нетоксичные парафразы для английских и русских токсичных предложений. Используя полученный набор данных, мы обучаем несколько моделей seq2seq детоксикации на собранных данных и сравниваем их с несколькими базовыми моделями и современными подходами, не требующими наблюдения. Все модели, обученные на параллельных данных, с большим отрывом превосходят современные модели. Во второй части доклада мы рассмотрим многоязычный эксперимент, в котором мы решаем проблему детоксикации текста для языка, на котором отсутствует параллельный корпус. Кроме этого, мы обсудим эксперименты в которых перевод и передача стиля должны решаться совместно.