Семинары 2014 года

20.11.2014

Докладчик: Alexei Ossadtchi, Ph.D.
Тема: MEG and EEG based neuroimaging of transient networks

Аннотация: As from a finite alphabet the complexity of a language stems so the richness of our behavioral patterns arises from specific hierarchical interaction of a finite set of functionally specialized brain regions. Such interactions are of transient nature with characteristic scale of hundreds of milliseconds and can be studied using electro- and magnetoencephalography (EMEG). EMEG noninvasively registers electrical activity of neuronal assemblies that coalesce and decoalesce in time providing for massively parallel and dynamic flow of information exchange in the brain. Such a rich exchange of information produces extremely complicated patterns of the observed activity, especially when complex cognitive phenomena are investigated. In order to make use of such measurements we need conceptually new data analysis and statistical tools for extracting relevant information.In this talk I will emphasize the benefits of network-based approach to neuroimaging. I will briefly describe the essentials of modern methods used for EMEG data analysis including inverse problem solving and synchrony assessment. Then I will introduce the concept of transient networks and by the way of examples from the recent literature and our own research will describe the results of utilizing such network-based approaches to analysis of EEG and MEG measurements. I will argue that exercising the network-centered view and using careful hypothesis-driven experimental planning combined with customized data analysis techniques it is possible to non-invasively discover the crucial information underlying brain function under pathological and normal conditions.

16.11.2014

Тема: Некоторые современные подходы к визуализации текстовых данных
Докладчик: Ильвовский Дмитрий, аспирант НИУ ВШЭ

Аннотация: Одной из важных задач анализа данных является не только собственно извлечение какой-либо информации из данных, но и наглядная и эффективная визуализация этой информации. В докладе на примере анализа текстовых данных будут рассмотрены несколько подходов к визуализации, такие как облака слов, отображение текстовой информации в виде "карты метро" и т.д. Также будут представлены прототипы нескольких программ, предназначенных для визуального анализа текстовых данных.

06.11.2014

Тема: Ленивая классификация с помощью ассоциативных правил.
Докладчик: Аспирант 2-го года департамента АДИИ Федор Строк.

Аннотация: Доклад посвящен ассоциативной классификации (Associative Classification) и родственным алгоритмам, то есть методам машинного обучения для задачи классификации. Основной идеей предлагаемых методов является явное использование ассоциативных правил, связывающих признаки с целевым. Ограничением можно считать экспоненциально большое число ассоциативных правил в худшем случае.

При эффективном извлечении правил, предлагаемый подход может превосходить ставший традиционным SVM метод. Предлагается извлекать лишь правила, которые позволяют различать объекты тестовой выборки.

В качестве прикладных задач обсуждались следующие: фильтрация спама, извлечение мнений, анализ социальных сетей и др.

23.09.2014

Докладчик: Евгений Колмаков, студент Факультета Вычислительной Математики и Кибернетики МГУ им. М. В. Ломоносова.
Тема: Метрический подход к модификации алгоритмов классификации на основе АФП

Аннотация: Алгоритмы классификации, основанные на анализе формальных понятий (АФП), могут работать с небинарным описанием объектов поразному: использовать их напрямую или перейти к бинарным признакам с помощью процедуры шкалирования. Общим недостатком классификаторов на основе АФП, использующих бинарные признаки, является то, что они забывают метрическую структуру исходного признакового пространства.

Основная идея этого доклада - использовать исходную метрическую информацию наряду с теоретико-порядковыми отношениями между объектами и признаками. Метрический подход в данной области позволяет существенно снизить число отказов от классификации и предоставляет дополнительную информацию об объектах, что даёт больше возможностей для построения классификаторов. Предлагается модель классификаторов, обобщающая некоторые из существующих классификаторов, основанных на АФП, и позволяющая модифицировать их.

Также в докладе обсуждается другой подход, использующий понятие метрики, а именно введение подходящей меры расстояния между понятиями, и её использование для модификации классификаторов.

26.06.2014

Докладчик: Бузмаков Алексей, аспирант НИУ ВШЭ.
Тема: Модели обработки сложноструктурированных данных на основе решёток замкнутых описаний.

Аннотация: Интеллектуальный анализ сложноструктурированных данных является важным направлением анализа данных. В первой части работы вводится понятие сложных последовательностей и математическая модель, позволяющая получать закономерности на такого вида данных с интеграцией различных знаний из предметной области. Данный подход применяется к анализу траекторий госпитализаций пациентов. Во второй части работы исследуется применение индекса устойчивости для выделения наиболее интересных закономерностей и экспериментально исследуются его свойства. Предлагается новый вариант индекса, имеющий лучшие вычислительные свойства.

24.06.2014

Докладчик: Prof. Andre Scedrov, University of Pennsylvania.
Тема: Collaborative Systems.

Аннотация: We discuss a model of collaboration, introduced in a joint work with Kanovich and Rowe, in which the participants are unwilling to share all their information with each other, but some information sharing is unavoidable when achieving a common goal. The need to share information and the desire to keep it confidential are two competing notions which affect the outcome of a collaboration. Our model is based on the notion of a plan which originates in the AI literature. We also consider an extension of the model which allows for updates of values with fresh ones, such as updating a password.

All the players inside our system, including potential adversaries, have similar capabilities. They have bounded storage capacity, that is, they can only remember a bounded number of facts. This is technically imposed by allowing only the so-called balanced actions, that is, actions that have the same number of facts in their pre and post conditions. We investigate the complexity of the planning problem, whether the players can reach a goal while avoiding certain critical configurations along the way. We show that this problem is PSPACE-complete. The complexity is lowered to NP-completeness for the class of so-called progressing collaborative systems, intended to describe administrative processes, which normally have a progressing nature:once an item in an activity to-do list is checked, that activity is not repeated.

As an application we turn to network security protocol analysis and demonstrate that when an adversary has enough storage capacity, then many known protocol anomalies can also occur in the presence of a bounded memory intruder. We believe that precisely this is a theoretical reason for the successful use in the past years of model checkers in security protocol verification. In particular, the known anomalies arise for bounded memory protocols, where there is only a bounded number of concurrent sessions and the honest participants of the protocol cannot generate an unbounded number of facts nor an unbounded number of fresh values. This led us to the question of whether it is possible to infer an upper-bound on the memory required by the adversary to carry out an anomaly from the memory restrictions of the bounded protocol. We answer this question negatively.

We also discuss timed versions of the model, in which one can specify and analyze security protocols that rely on the assumptions on the physical properties of the environment in which its protocol sessions will be carried out. For instance, so-called distance bounding protocols take into account the round trip time of messages and the transmission velocity to infer an upper bound of the distance between two agents. We prove that models with discrete time are not able to expose as many security flaws as models with continuous time. This is done by proposing a protocol and demonstrating that there is no attack to this protocol when using the model with discrete time, but there is an attack when using the model with continuous time.This is joint work with Max Kanovich, Tajana Ban Kirigin, Vivek Nigam and Carolyn Talcott.

05.06.2014

Докладчик: Дударев Виктор Анатольевич.
Тема: Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ.

Аннотация: В работе кратко рассматриваются методы компьютерного конструирования неорганических соединений. Выделяется метод поиска многомерных эмпирических классифицирующих закономерностей как наиболее перспективный для прогнозирования свойств неорганических веществ. Приводятся информация по созданию автором ряда информационных систем по свойствам неорганических веществ и материалов. Рассматривается методология интеграции информационных систем по свойствам неорганических веществ и материалов, основанная на трех методах интеграции: EAI, EII и ETL, а также создание интегрированной информационной системы по свойствам неорганических веществ в ИМЕТ РАН. Приводятся результаты использования интегрированной информационной системы в комплексе с программами распознавания образов для решения практических задач компьютерного конструирования неорганических соединений.

22.05.2014

Докладчик: Ильвовский Дмитрий Алексеевич.
Тема: Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний.

Аннотация: Расширением идеи дерева синтаксического разбора на случай текстового абзаца является модель семантико-синтаксического представления текста - чаща разбора (Parse Thicket). Наряду с синтаксическими связями для построения чащи используются семантические теории, позволяющие устанавливать связи между предложениями абзаца: теория риторических структур, теория речевых актов, разрешение анафор, таксономические связи. Данная модель позволяет работать с текстом как со структурой (графом или множеством деревьев) и применять структурные методы обработки и сходства. Используя чащи разбора, мы можем задать сходство текстов как операцию наименее общего обобщения (или полурешеточную операцию пересечения) их чащ. Вместе с использованием методов из теории решеток замкнутых множеств и ядерных методов машинного обучения эта модель предоставляет нам богатый аппарат по поиску, классификации и кластеризации коротких текстов. Будут рассматрены приложения модели, позволяющие улучшить результаты поиска и классификации, также будете приведен алгоритм иерархической кластеризации и рассмотрена задача автоматического построения семантических связей "та же сущность" для предобработанного текста.

20.05.2014

Докладчик: Пьяных Олег Станиславович, профессор ВШЭ, Senior Scientist, Massachusetts General Hospital, Assistant Professor, Harvard Medical School.
Тема: Большие данные в медицине: как заставить их работать?.

Аннотация: За последние 20 лет с начала перехода на цифровой формат, современная медицина накопила огромный объем данных, который практически никак не используется. Анализ этих данных, и извлечение из них новой оптимальной логики управления является одним из наиболее востребованных направлений прикладной математики.

24.04.2014

Докладчик: Radhakrishnan Delhibabu, SSN College of Engineering, Chennai, research Scholar.
Тема: Dynamic of belief with decision making in Database theory and cognitive robotic.

Аннотация: The dynamics of belief and knowledge is one of the major components of any autonomous system that should be able to incorporate new pieces of information. In this paper, we argue that to apply rationality result of belief dynamics theory to various practical problems, it should be generalized in two respects: first of all, it should allow a certain part of belief to be declared as immutable; and second, the belief state need not be deductively closed. Such a generalization of belief dynamics, referred to as base dynamics, is presented, along with the concept of a generalized revision algorithm for Horn knowledge bases. We show that Horn knowledge base dynamics has interesting connection with kernel change and abduction. Finally, we also show that both variants are rational in the sense that they satisfy certain rationality postulates stemming from philosophical works on belief dynamics.

21.04.2014

Докладчик: Бузмаков Алексей, аспирант НИУ ВШЭ.
Тема: Построение знаний по данным со сложной структурой на основе решеток замкнутых описаний.

20.04.2014

Докладчик: Дмитрий Петрович Ветров, руководитель группы Байесовских методов, доцент ВМК МГУ
Тема: Байесовский подход к машинному обучению и пути его развития

Аннотация: В докладе будут кратко охарактеризованы основные направления развития теории машинного обучения в настоящее время и основные направления исследований группы Байесовских методов. Более подробно будет изложен аппарат т.н. вероятностных графических моделей, являющийся на сегодня популярным средством построения новых моделей и алгоритмов машинного обучения, учитывающих специфику конкретной прикладной задачи. Также будет рассмотрен байесовский язык описания вероятностных моделей и кратко изложены непараметрические байесовские методы и методы глубинного обучения.

17.04.2014

Докладчик: Alexey Lavrentev (Алексей Лаврентьев) ICAR Research Lab - CNRS, Université de Lyon, ASLAN Labex
Тема: Виды разметки и средства количественного и качественного анализа корпусов текстов.

Аннотация: В докладе будут рассмотрены проблемы совместимости глубокой филологической разметки электронных документов на основе стандарта XML-TEI с инструметами автоматического лингвистического анализа (в частности, TreeTagger'ом), а также возможности эксплуатации различных видов разметки на базе платформы TXM.

27.03.2014

Докладчик: Валерий Топинский, аспирант НИУ ВШЭ.
Тема: Резервные цены в ассиметричных аукционах.

Аннотация: Как аукционист может максимизировать свой доход? В теории ответ на данный вопрос дает оптимальный механизм Майерсона [Myerson’81]. В случае симметричных моделей достаточно запустить аукцион первой или второй цены с правильно подобранной резервной ценой. Но на практике часто возникает асимметрия между покупателями, и в такой ситуации механизм Майерсона практически не возможно реализовать в силу сложной природы правил размещения и платежей, которые прямо зависят от предполагаемых распределений ценностей покупателей. Более того, такие правила будут меняться от одного товара к другому вместе с тем, как будут меняться соответствующие распределения ценностей. Поэтому в множестве ситуаций на практике механизм Майерсона не применим.

В таких ситуациях аукционист по прежнему может использовать аукционы простого формата с аккуратно подобранной резервной ценой. В работе получен ответ о том, каким образом определять оптимальное значение резервной цены для класса аукционов эквивалентных VCG механизму с асимметричными покупателями в предположении единичного спроса в зависимости от различных представлений аукциониста об участниках. Рассматриваются четыре модели различные по степени информированности аукциониста: от наиболее детального случая знаний про множество участников и их функции распределений ценностей до симметризованного случая, когда аукционист игнорирует возможную асимметрию.

Было показано, что при увеличении информированности аукционист может извлечь дополнительный доход только тогда, когда ему становится доступной информация об количествах участников заданного типа. Более того, любое дальнейшее увеличение детальности его знаний оказывается бесполезным для дальнейшей максимизации дохода аукциониста. Другими словами, чем менее информирован аукционист, тем больше он недооценивает резервные цены. В работе показано, что дополнительный эффект на доход аукциониста значим.

27.03.2014

Докладчик: Анна Сорокина, аспирантка НИУ ВШЭ.
Тема: Оптимизация показов рекламных объявлений в поисковых интернет-системах: разработка методологии подбора порогов входа в рекламный показ

Аннотация: Каждый день в систему показов рекламных объявлений поисковой системы поступает огромное количество объявлений от рекламодателей. Главная цель рекламодателя – чтобы его реклама была показана на главной странице поисковой выдачи по запросам, соответствующим тематике рекламного объявления. В работе предложен алгоритм отбора объявлений для каждого поискового запроса для показа рекламы по нему. Была сформулирована, математически описана и решена соответствующая оптимизационная задача с учётом ограничений уже существующей системы, таких как суммарный доход поисковой системы, а также доля запросов, по которым реклама может быть показана над результатами поиска. Критерием оптимальности служит эффективность показов рекламных объявлений, которая определяется удовлетворённостью пользователей и, соответственно, увеличением их внимания к рекламной выдаче на главной странице поиска.

20.03.2014

Докладчик: Ильвовский Дмитрий Алексеевич, аспирант НИУ ВШЭ
Тема: Модели, численные методы и программные комплексы обработки текстовых данных с использованием решеток замкнутых множеств.

Аннотация: Будут рассмотрены несколько моделей, предназначенных для обработки текста и базирующихся на использовании решеток замкнутых множеств. В частности, речь пойдет о методах выявления тождественных денотатов в прикладных онтологиях и формальных контекстах, построенных на основе текстовых данных. Также будет представлена модель представления текстового абзаца, использующая семантико-синтаксическую структуру текста, и её приложения в области информационного поиска, классификации и кластеризации текстов.

06.03.2014

Speaker: Laurent Bienvenu, Laboratoire J-V. Poncelet, Independent University of Moscow
Title: Classification by compression

Abstract: In my previous talk, I introduced the notion of Kolmogorov complexity, which measure the ‘amount of information’ of finite discrete objects. In this second talk, I will present one of the possible applications of Kolmogorov complexity to classification, due to Cilibrasi and Vitanyi. First, we will see that Kolmogorov complexity can be used to construct a distance between finite objects, in a way that similar objects should be close to each other. Of course, since Kolmogorov complexity is not a computable function, the constructed distance is not either. However, we will see that by using computable estimates of Kolmogorov complexity (obtained with common compression softwares such as gzip), we can get a reasonable distance which is good enough for classification of information. We will see how this distance behaves for the classification of books by author.

20.02.2014

Докладчик: Жуков Леонид Евгеньевич, профессор кафедры анализа данных и искусственного интеллекта ОПМИ НИУ ВШЭ.
Тема: Learning from Historical Data

Аннотация: В последние годы генеалогия, или изучение родственных взаимосвязей людей, становится все более популярной. Появилось много компаний и вебсайтов использующих краудсорсинг для построения генеалогических (семейных) деревьев, сбора и анализа исторической информации. Ancestry.com - крупнейшая генеалогическая компания в мире, которая обладает более 11 миллиардами исторических записей и 40 миллионами созданных пользователями деревьев. Ее сервисами пользуются более 2 миллионов подписчиков ежемесячно. На семинаре я расскажу о сервисах предоставляемых Ancestry.com, данных, которыми она обладает, а также о технических и научных задачах возникающих в процессе обработки этих данных и примерах использование методов машинного обучения для решения возникающих задач. Мы более детально остановимся на одной из типичных проблем встающих перед исследователями - умением видоизменять имена и фамилии при поиске информации в исторических документах. Это задача важна не только в генеалогических исследованиях, но и в любых системах поиска и идентификации людей и записей - банковских, страховых, государственных, медицинских и других информационных системах. Я расскажу о стандартных фонетических и string similarity алгоритмах для entity resolution/ record linkage, а также об использовании для решения этой задачи алгоритмов статистического машинного перевода и приведу результаты тестирование и сравнения алгоритмов на данных Ancestry.com.

13.02.2014

Докладчик: Осипов Геннадий Семенович, заместитель директора по науке ИСА РАН, профессор, доктор ф-м н., зам. заведующего базовой кафедрой «Математические методы системного анализа» ИСА РАН на ОПМИ
Тема: Реляционно-ситуационный метод поиска и анализа полу-структурированной информации.

Аннотация: Доклад посвящен новым методам анализа полу-структурированной информации. Метод основан на коммуникативной грамматике русского языка и теории неоднородных семантических сетей. Применение метода к задачам поиска позволяет увеличить точность последнего; применение к анализу научно-технических текстов- решать задачи оценки близости текстов, оценки степени их дефектности, выделения из текста целевой информации, в частности, -авторских терминов, результатов и некоторые иные.

06.02.2014

Докладчик: Аржанцев Иван Владимирович, профессор, д.ф.м-н., заведующий базовой кафедрой анализа интернет-данных (Яндекс)
Тема: Некоторые актуальные задачи алгебры и алгебраической геометрии

Аннотация: В этом обзорном докладе планируется краткий рассказ о задачах, связанных с комбинаторными и алгоритмическими методами в алгебре и геометрии.

Алгебраическая геометрия изучает алгебраические многообразия, т.е. множества решений систем полиномиальных уравнений. Как работать с такими объектами?

Важную роль здесь играют методы, основанные на понятии базиса Гребнера идеала в кольце многочленов. Многие многообразия допускают комбинаторное описание в терминах вееров, составленных из полиэдральных конусов (торические многообразия) или в терминах колец с однозначным разложением на простые множители (теория колец Кокса). Также мы поговорим о симметриях многообразий, в частности, о бесконечной транзитивности для группы автоморфизмов. Известными предполагаются только сведения из базового курса алгебры, остальные понятия будут определены в процессе доклада.

30.01.2014

Докладчик: Бучин Анатолий Юрьевич, Ecole Normale Superiere, Laboratoire des Neurosciences Cognitives, Group for Neural Theory
Тема: Модель бистабильности и обратного стохастического резонанса клеток Пуркинье

Аннотация: Клетки Пуркинье играют важную роль в работе мозжечка. Анатомически их таксоны являются единственной проекцией коркового слоя мозжечка в его подкорковые структуры. Данные нейроны обладают возбудимостью второго типа, что может быть экспериментально выявлено в разрывной характеристике вход-выход. Данное свойство мембранных токов клеток Пуркинье может лежать в основе их бимодального поведения in vivo, которое может быть связано с предлагаемой бистабильностью. Экспериментально бистабильность может быть выявлена в ответ на стимуляцию с помощью возрастающей и убывающей ступеньки входного тока. При этом в ответ на одно и то же значение входного тока клетка будет отвечать разным количеством спайков в зависимости от истории стимула, т. е. будет наблюдаться гистерезис частоты спайков. Помимо бистабильного поведения спайковая активность клетки Пуркинье может быть заторможена за счет приложения стимула, сгенерированного в виде цветного шума. Данный эффект, недавно обнаруженный в теоретических моделях отдельных нейронов, называется обратный стохастический резонанс . В этой работе мы показываем, что этот эффект экспериментально наблюдается в клетках Пуркинье и связан с их бистабильным поведением in vivo. Мы используем модель типа aEIF для воспроизведения обратного стохастического резонанса и гистерезиса частоты спайков клеток Пуркинье. Затем мы проводим бифуркационный анализ модели для объяснения этих эффектов с точки зрения нейлинейной динамики. Мы предлагаем, что обратный стохастический резонанс клеток Пуркинье может служить объяснением переключений между состояниями покоя и спайковой активности in vivo, а также показываем, что обратный стохастический резонанс может иметь преимущество для обработки информации.

25.01.2014

Докладчик: Tomasz Kociumaka, Warsaw university
Тема: Fast Algorithms for Abelian Periods in Words and Greatest Common Divisor Queries

Аннотация: Two words are commutatively equivalent, if one can be obtained from the other by permutation of its letters. A word has a full Abelian period p if it can be partitioned into commutatively equivalent factors of length p, and a regular Abelian period p, if it can be extended (to the right) so that the extension has full Abelian period p.

We present efficient algorithms computing all Abelian periods of both types in a word. Regular Abelian periods are computed in O(n log log n) time by a randomized algorithm, which improves upon the best previously known solution almost by a factor of n. The other algorithm, for full Abelian periods, works in O(n) time.

As a tool we develop a data structure that after O(n)-time preprocessing allows O(1)-time gcd(i,j) queries for all 1≤i,j≤n; this is a result of independent interest.

This is joint work with Jakub Radoszewski & Wojciech Rytter (University of Warsaw).

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Международная лаборатория интеллектуальных систем и структурного анализа

Семинары 2014 года

20.11.2014

16.11.2014

06.11.2014

23.09.2014

26.06.2014

24.06.2014

05.06.2014

22.05.2014

20.05.2014

24.04.2014

21.04.2014

20.04.2014

17.04.2014

27.03.2014

27.03.2014

20.03.2014

06.03.2014

20.02.2014

13.02.2014

06.02.2014

30.01.2014

25.01.2014