Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 109028, г. Москва, Покровский бульвар, д. 11
Телефон: +7 (495) 531-00-00 *27254
Email: computerscience@hse.ru
Для исследователя в такой разнообразной и быстро развивающейся области знаний, как компьютерные науки, важно сохранять широту кругозора и стремиться понимать, чем занимаются коллеги в смежных областях. Для этого нужна площадка, на которой специалисты встречаются и рассказывают друг другу о последних результатах понятным языком. Такой площадкой и является Коллоквиум факультета компьютерных наук ВШЭ — общефакультетский научный семинар, предназначенный для преподавателей и научных сотрудников факультета, аспирантов, магистрантов и студентов бакалавриата, а также для всех интересующихся компьютерными науками.
Заседания коллоквиума проходят, как правило, раз в две недели по вторникам онлайн.
Записи мероприятий доступны на канале факультета на YouTube.
Alexander Panchenko
In this talk, I will provide a brief survey of recent neural entity linking (EL) systems developed since 2015 as a result of the "deep learning revolution" in NLP. I will try to systemize design features of neural entity linking systems and compare their performances to the best classic methods on the common benchmarks distilling generic architectural components of a neural EL system, like candidate generation and entity ranking summarizing the prominent methods for each of them, such as approaches to mention encoding based on the self-attention architecture.
Besides, various modifications of this general neural entity linking architecture can be grouped by several common themes: joint entity recognition and linking, models for global linking, domain-independent techniques including zero-shot and distant supervision methods, and cross-lingual approaches. Since many neural models take advantage of pre-trained entity embeddings to improve their generalization capabilities, I will also briefly discuss several types of entity embeddings. Finally, we briefly discuss classic applications of entity linking, focusing on the recently emerged use-case of enhancing deep pre-trained masked language models such as BERT. The materials are based on the following survey: Özge Sevgili, Artem Shelmanov, Mikhail Arkhipov, Alexander Panchenko, and Chris Biemann (2021): Neural Entity Linking: A Survey of Models based on Deep Learning. CoRR abs/2006.00575
The talk will be given in English.
Афиша
Алексей Наумов
Теория случайных матриц и методы, используемые при исследовании случайных матриц, играют важную роль в различных разделах теоретической и прикладной математики. Случайные матрицы возникли из приложений, сначала в анализе данных, а позже в качестве статистических моделей в квантовой механике, вычислительной математике, финансовой инженерии, теории информации, машинном обучении и других областях. В последние двадцать лет произошел настоящий бум в развитии теории случайных матриц. Были получены прорывные результаты. В своем докладе я расскажу об основных законах, возникающих в поведении спектра случайных матриц, а также о некоторых приложениях. Доклад частично основан на моих совместных работах с Фридрихом Гётце и Александром Тихомировым.
Афиша
Никита Животовский
In this talk we consider the robust algorithms for the k-means clustering problem where a quantizer is constructed based on N independent observations. We start with an overview of the methods of robust statistics. First, we discuss the median-of-means estimator. This simple estimator allows us to evaluate the mean of some heavy-tailed distribution as if this distribution was Gaussian. We discuss some extensions to the multivariate case. In the context of clustering, we present the median of means based non-asymptotic distortion bounds that hold under the two bounded moments assumption. In particular, our results extend the renowned asymptotic result of Pollard who showed that the existence of two moments is d sufficient for strong consistency of an empirically optimal quantizer in R . In a special case of clustering in Rd , under two bounded moments, we show matching non-asymptotic upper and lower bounds on the distortion, which depend on the probability mass of the lightest cluster of an optimal quantizer. This talk is based mainly on the joint work with Y. Klochkov and A. Kroshnin (
https://arxiv.org/abs/2002.02339
to appear in Annals of Statistics).
The talk will be given in English.
Афиша
Евгений Бурнаев, Сколтех
Современная диагностика и прогноз лечения в таких областях, как нейрохирургия, неврология и психиатрия, требуют анализа изображений, полученных в различных модальностях: структурно-функциональной магнитно-резонансной томографии (МРТ), позитронно-эмиссионной томографии (ПЭТ), а также данных об электрической активности головного мозга (ЭЭГ). В психофизиологических исследованиях учебного процесса и при подготовке киберспортсменов сбор данных также возможен за счет использования носимой электроники и устройств слежения за движениями зрачков. Такого рода данные имеют сложную структуру и высокую размерность. Соответственно, требуется развитие новых методов машинного обучения. В докладе я расскажу о постановках основных задач и наших последних результатах в области эффективного снижения размерности данных фМРТ для картирования функциональных областей мозга при хирургическом планировании и нейронавигации, сегментации трехмерных МРТ-изображений для выявления поражений и т.д.
Афиша
Максим Рахуба, НИУ ВШЭ
В докладе будут рассмотрены различные способы обобщить одно из центральных матричных разложений – сингулярное разложение – на случай многомерных массивов. Во многих прикладных задачах такие разложения, также именуемые тензорными, позволяют преодолеть проблему экспоненциального роста числа параметров при увеличении размерности многомерного массива.
Мы также поговорим о том, как и зачем использовать тензорные разложения в задачах с малой размерностью, например, в применении к одномерным или двумерным массивам; обсудим последние теоретические результаты для приближения функций и использование такого подхода в глубинном обучении.
Афиша
Запись
Михаил Посыпкин, НИУ ВШЭ
В докладе рассматриваются современные методы детерминированной глобальной оптимизации, гарантирующие точность получаемых решений. Будет рассказано о методенеравномерных покрытий и его применении к задачам
оптимизации с одним и несколькими критериями. Также будет уделено внимание автоматизированному синтезу оценок по формуле функции для одномерной глобальной оптимизации. В докладе планируется затронуть приложения изложенных подходов к задачам определения рабочей области и критических точек роботов параллельной структуры.
Афиша