Семинары 2023
Семинар “Автоматическая обработка и анализ текстов” посвящен различным задачам обработки (токенизации, восстановлению сегментации, частеречной разметки и синтаксического парсинга) и анализа текстовой информации (задачам извлечения информации, построения и использования графов знаний, конструированию вопросно-ответных систем, классификации текстов и др.).
Онлайн семинар "Modeling and Predicting Helpfulness of Online reviews"
Дата: 2 февраля 2023 г.
Докладчик: Малик Мухаммад Шахид Икбаль, научный сотрудник, Научно-учебная лаборатория моделей и методов вычислительной прагматики, Департамент анализа данных и искусственного интеллекта, Факультет компьютерных наук, НИУ ВШЭ.
Аннотация: Consumers prefer reading online reviews before making their buying decisions. However, it is challenging to discern the best online reviews due to the large volume of online reviews for some products. In this regard, the helpfulness characteristic of online reviews is effective in dealing with information overload and supports consumers in their decision-making process. In this talk, I will share my contributions in developing predictive models for helpfulness of product reviews. I addressed helpfulness in two prospective: Binary classification and Regression model. Several newly-proposed review content, reviewer, and product features are investigated. Specifically, state-of-the-art semantic, word contextual embedding and language models are explored. Likewise, popular machine learning, ensemble and deep learning models are also utilized to build the effective frameworks. Accordingly, our work could be of value to the research community concerned by identifying what makes a review helpful or not helpful by uncovering the importance of new indicators that sheds light on the empirical relationship between these variables and review helpfulness. Additionally, our work has important implications for marketing professionals and retailer platforms that can utilize our results to optimize their customer feedback systems, enhance reviewer guidelines, and include more useful product reviews.
Запись семинара по ссылке
Семинар НУЛ ММВП "Предсказание структурных объектов на основе формальных контекстов и данных на естественном языке"
Дата: 30 марта 2023 г.
Докладчик: Рамиль Яруллин, аспирант 4-го курса и преподаватель департамента больших данных и информационного поиска ФКН. Исследования, о которых будет рассказано в докладе, сделаны в рамках аспирантской школы, работы в Яндексе и научно-учебной лаборатории Яндекса на ФКН.
Аннотация: В докладе будет рассмотрено несколько задач построения и предсказания структурных объектов на основе данных – начиная с формальных контекстов, заканчивая текстовыми данными на естественном языке. В первой части доклада будет рассказано о теоретической работе, посвященной построению приближенного вероятностного базиса импликаций для формальных контекстов. Во второй части речь пойдет о текстовых контекстах на естественном языке и подходе к задаче текстовой классификации с пересекающимися классами при помощи генерации последовательности классовых меток. В частности, мы рассмотрим постановку задачи с имеющейся иерархической структурой классов и обсудим метод, комбинирующий стандартную для модели BERT архитектуру и подход с последовательным предсказанием меток. В третьей части доклада мы перейдем к задаче ответа на числовые вопросы по текстовому и табличному контексту, где для ответа на вопрос требуется последовательное применение различных дискретных операций, таких как подсчет, сравнение чисел, сортировка и выполнение арифметических выражений. Будет рассказано про новую нейросетевую модель, которая на текущий момент показывает лучшие результаты в этой задаче.
Запись семинара по ссылке
Предварительная защита кандидатской диссертации Михайлова Владислава Николаевича
26 апреля 2023 года в 15:00 на заседании Департамента больших данных и информационного поиска факультета компьютерных наук состоялась предварительная защита кандидатской диссертации Михайлова Владислава Николаевича на тему: «Эталонное тестирование языковых моделей на задачах понимания естественного языка» (научная специальность 1.2.1 Искусственный интеллект и машинное обучение).
Научный руководитель: к. техн. наук, Артёмова Екатерина Леонидовна, Postdoctoral Researcher, LMU Munich
Рецензенты:
— Екатерина Логинова, Doctor of Business Economics, Ghent University
— Максим Панов, к. физ.-мат. н., Senior Researcher, Technology Innovation Institute, Abu Dhabi, UAE
Семинар НУЛ ММВП: “You Told Me That Joke Twice: A Systematic Investigation of Transferability and Robustness of Humor Detection Models”
Дата: 11 октября 2023
Докладчик: Баранов Александр, аспирант департамента больших данных и информационного поиска ФКН.
Аннотация: In this research presentation, we investigate the important field of automatic humor detection within conversational AI. Although there are multiple English humor datasets, there is little information about the generalization and real-world behavior of models trained on them. Our thorough analysis includes examining existing datasets, training RoBERTa-based classifiers on each one, and carrying out extensive cross-dataset testing. Additionally, we use large language models (LLMs) to perform thorough testing and evaluate their effectiveness in detecting humour.
Семинар НУЛ ММВП: "Применение методов машинного обучения к неполным и зашумленным данным"
Дата: 17 октября в 18:00
Докладчик: Сотский Арсений Евгеньевич, аспирант факультета математики.
Аннотация: Мы продолжаем серию коротких выступлений аспирантов. Аспирант 1-го года обучения факультета математики, Арсений Сотский представит доклад по применению методов машинного обучения к неполным и зашумленным данным. В докладе рассмотрены различные способы обработки и анализа данных, значительная часть которых пропущена, на примере медицинской базы данных. Кроме того, по схожей теме Арсением в соавторстве была проделана работа в Гидрометцентре и опубликован препринт (https://arxiv.org/abs/2306.14318) по применению ансамблевых фильтров Калмана для предсказания локальных спектров нестационарных случайных процессов на сфере при условии неполных данных.
The international workshop on Data and Computation for Materials Science and Innovation (DACOMSIN)
Дата: 24.10.2023
Место проведения: Покровский бульвар, 11. В рамках конференции DAMDID 2023 .
О семинаре:
Materials data collection and systematization that initially used traditional means of data publication then acquired a status of a discipline of its own and much accelerated with the advent of computers. The proliferation of Big Data in materials characterization added up to the requirement of having scalable and interoperable data infrastructures for materials research and innovation.
Extensive bibliographic and material properties databases laid a foundation for machine-assisted data harvesting, data analysis and data repurposing. Design of new materials with the predefined functional properties, and matching in silico models with experimental data have become a reality across the globe and inspired a few national initiatives in materials genome.
The progress of information technology has made it possible to not only use computers for data management and data analysis, but also made computers a viable tool for experimentation on par with physical and chemical experiments. Powerful software platforms and high quality simulated data are now prime citizens in many research and innovation settings.
The domains of materials data infrastructures, materials data analysis and materials in silico experiments have accumulated thriving communities that enjoy regular gatherings and have dedicated professional bodies for ongoing discussions. There is a lack of a common forum though with the prime purpose of multilateral and mutually beneficial discussions across all three communities.
The DACOMSIN workshop is going to address this communication gap and bring together professionals from across research and innovation to share their experience and perspectives of using information technology and computer science for materials data management, analysis and simulation.
Information technology and computer science that intrinsically underpin each of the three pillars of the workshop should be able to become a universal glue, too, that can get these areas closer to each other and can support seamless transition from materials research to pilot innovative applications and eventually to scalable industrial deployments.
Страница семинара
Семинар НУЛ ММВП: "Отдельные вопросы задачи реферирования текстов"
Дата: 20 декабря в 17:30
Спикер: Валентин Малых, руководитель направления NLP-исследований в MTS AI и преподаватель департамента программной инженерии факультета компьютерных наук.
Аннотация:
В своем докладе я предлагаю рассмотреть задачу реферирования текстов так, что различные работы в этой области ложатся в одну структуру. Я затрону разные аспекты этой задачи, включая сбор корпусов и оценивание, которое часто выпадает из внимания исследователей.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.