• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 125319, г. Москва, 
Кочновский проезд, д. 3 (станция метро "Аэропорт").

Телефон: +7 (495) 772-95-90 *12332

Email: computerscience@hse.ru

 

Руководство

Декан Аржанцев Иван Владимирович

Первый заместитель декана Вознесенская Тамара Васильевна

Заместитель декана по научной работе и международному сотрудничеству Объедков Сергей Александрович

Заместитель декана по учебно-методической работе Самоненко Илья Юрьевич

Заместитель декана по развитию и административно-финансовой работе Плисецкая Ирина Александровна

Мероприятия
1 апреля – 13 апреля
9 апреля – 10 апреля
Прием работ — до 31 марта 2019 
12 июня – 14 июня
submission: 1 May 2019 
26 августа – 30 августа
Registration and Poster Submission deadline — April 1, 2019 
Образовательные программы
Бакалаврская программа

Прикладная математика и информатика

4 года
Очная форма обучения
110/80/15
110 бюджетных мест
80 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Бакалаврская программа

Программа двух дипломов НИУ ВШЭ и Лондонского университета "Прикладной анализ данных"

4 года
Очная форма обучения
70/12
70 платных мест
12 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Бакалаврская программа

Программная инженерия

4 года
Очная форма обучения
80/70/15
80 бюджетных мест
70 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Магистерская программа

Анализ данных в биологии и медицине

2 года
Очная форма обучения
15/5/2
15 бюджетных мест
5 платных мест
2 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Науки о данных

2 года
Очная форма обучения
55/15/6
55 бюджетных мест
15 платных мест
6 платных мест для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Системная и программная инженерия

2 года
Очная форма обучения
25/5/8
25 бюджетных мест
5 платных мест
8 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Системное программирование

2 года
Очная форма обучения
15/5/2
15 бюджетных мест
5 платных мест
2 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Статистическая теория обучения

2 года
Очная форма обучения
20/5/4
20 бюджетных мест
5 платных мест
4 платных места для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Финансовые технологии и анализ данных

2 года
Очная форма обучения
35/3
35 платных мест
3 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Статья
Branching rules related to spherical actions on flag varieties
В печати

Roman Avdeev, Petukhov A.

Algebras and Representation Theory. 2019.

Статья
Minimax theorems for American options without time-consistency

Belomestny D., Kraetschmer V., Hübner T. et al.

Finance and Stochastics. 2019. Vol. 23. P. 209-238.

Статья
Cherenkov detectors fast simulation using neural networks

Kazeev N., Derkach D., Ratnikov F. et al.

Nuclear Instruments and Methods in Physics Research, Section A: Accelerators, Spectrometers, Detectors and Associated Equipment. 2019.

Глава в книге
Averaging Weights Leads to Wider Optima and Better Generalization

Izmailov P., Garipov T., Подоприхин Д. А. et al.

In bk.: Proceedings of the international conference on Uncertainty in Artificial Intelligence (UAI 2018). 2018. P. 876-885.

Как научить машину предсказывать желания человека

Возможности машинного обучения позволяют прогнозировать появление искусственного интеллекта уже через несколько лет. Об этом рассказывает руководитель департамента больших данных и информационного поиска факультета компьютерных наук ВШЭ Дмитрий Ветров. Статья является частью совместного проекта Forbes и сайта «Постнаука».

Машинное обучение — это область математики, которая занимается поиском скрытых закономерностей в тех данных, которыми оперирует компьютер. Под «данными» в традиционной математике понимается некая совокупность объектов. На практике в  качестве объектов могут выступать, например, пользователи социальной сети, изображения, клиенты банков, страны, РНК, результаты экспериментов с Большого адронного коллайдера и так далее. Единственное требование, предъявляемое математикой к объекту, заключается в том, что он должен быть описан некоторой совокупностью переменных, которые, собственно, его характеризуют.

Машинное обучение начинается в тот момент, когда переменные, которыми описывается объект, становится возможным поделить на две части: наблюдаемые и скрытые (латентные) переменные. Наблюдаемые — это те, которые мы можем измерить у любого из всей совокупности объектов. Скрытые же, или латентные переменные, мы можем измерить у ограниченного количества объектов, потому что, как правило, их измерение сопряжено с какими-либо затратами (финансовыми, временными, и пр.). При этом предполагается, что между наблюдаемыми и скрытыми переменными есть некоторая взаимосвязь.

 На поиск этой взаимосвязи и направлены современные алгоритмы машинного обучения

В тех случаях, когда существуют известные математические модели, увязывающие наблюдаемые и скрытые компоненты в общие уравнения, в машинном обучении нет необходимости. Однако большинство задач, которые возникают в реальности, как правило, связаны с анализом данных (явлений), для которых, ни физических, ни математических моделей, в настоящее время, не существует, но зато можно собрать достаточно большую обучающую выборку.

Обучающая выборка — это совокупность объектов, для которых известны и наблюдаемые, и скрытые компоненты. Задача алгоритма машинного обучения —  анализируя обучающую выборку, приближенно восстановить взаимосвязь между наблюдаемыми и скрытыми компонентами, с помощью которой можно было бы прогнозировать значения скрытых компонент.

 Классический пример — это банковский кредитный скоринг

Предположим, вы — банкир, и у вас есть клиенты, которые очень хотят получить кредит. Кто-то собирается открыть свое дело, а кому-то кредит нужен, чтобы купить ящик водки и выпить ее. Возникает вопрос: кому кредит выдавать можно, а кому лучше не выдавать, потому что он его не вернет. Здесь в качестве наблюдаемых переменных у нас выступают характеристики клиентов. Например, те данные, которые они указывают в анкетах: пол, возраст, образование, уровень доходов, состав семьи и так далее. В качестве скрытой компоненты в простейшем случае выступает бинарная величина — вернет клиент кредит или не вернет. Если он его вернет, то имеет смысл ему этот кредит выдать.

В более сложных расчетах риск невозврата кредита оценивается как вероятность, с которой кредит может не быть возвращен. В этом случае создаются более сложные экономические модели принятия решения, когда лучше выдавать кредит.

Предположим, у нас было 400 клиентов, из которых, 350 вернули кредит. Это пример объектов, у которых скрытая компонента имеет значение +1; а 50 клиентов, которые, как оказалось, кредит не вернули — это примеры объектов со скрытой компонентой, которая приняла значение -1. В принципе, этого достаточно для того, чтобы ставить задачу машинного обучения и пытаться автоматически находить закономерности между наблюдаемыми и скрытыми компонентами в надежде, что они помогут нам определить, каким новым клиентам стоит выдавать кредит, а каким — нет.

В настоящее время дополнительный импульс развитию методов машинного обучения придал интернет и появившиеся новые технологии. Например, поисковые системы, социальные сети, блогосфера, биоинформатика. Задачи, возникающие в этих предметных областях, часто требуют применения современных методов машинного обучения. Именно поэтому в настоящее время в мире наблюдается растущий спрос на специалистов машинного обучения: они нужны в биологических лабораториях, компаниях -ритейлерах, в инвестиционных банках, а также в интернет-компаниях, в том числе таких, как Facebook, Google, Yandex.

 С помощью алгоритмов машинного обучения можно развивать персонифицированные сервисы

Например, когда мы вводим запрос в поисковую систему, она анализирует наше поведение — на какие ссылки мы кликаем, сколько секунд проводим, изучая результаты поиска, как управляем курсором мыши. Собираемая информация используется для корректировки результатов выдачи наших будущих поисковых запросов, так, чтобы в начале списка были те ресурсы, которые именно мы, а не компьютер, считаем наиболее релевантными. Именно поэтому так сложно переходить с привычной поисковой системы на новую — она еще не знает наших склонностей и предпочтений и выдает по нашим запросам наиболее релевантные ссылки с точки зрения поисковой системы, без адаптации под наши индивидуальные вкусы.

Похожие задачи возникают в социальных сетях, например, если требуется решить, каким пользователям какие рекламные баннеры демонстрировать. Ведь полезную рекламу мы воспринимаем как само собой разумеющееся, а бесполезная реклама раздражает. Возникает естественная задача отображать конкретному пользователю те баннеры, которые рекламируют товары, к приобретению которых он морально готов. В ближайшие годы, аналогичные технологии избирательного рекламного действия появятся и на телевидении. Тогда в перерыве футбольного матча Вы будете видеть рекламу чипсов, а Ваш пожилой сосед — рекламу средства от ревматизма.

По похожим принципам устроены так называемые рекомендательные сервисы. Они стали особенно востребованы с развитием интернет-коммерции. Когда мы заходим в интернет-магазин, наименования которого составляют сотни тысяч товаров, мы физически не в состоянии просмотреть все товары. Естественно, интернет-магазин заинтересован в том, чтобы показывать пользователю те товары, которые он с большей вероятностью купит. И  для того, чтобы такие товары определить, необходимо построить рекомендательную систему, которая рекомендовала бы тот или иной товар, базируясь на нашей истории покупок и истории покупок других пользователей, чьи вкусы система читает близкими к нашим. Методы для построения таких систем породили целый раздел в машинном обучении — так называемую «коллаборативную фильтрацию». Специалисты по коллаборативной фильтрации (в настоящее время в России их буквально по пальцам можно пересчитать) пользуются сейчас очень большим спросом.

 

 Современные алгоритмы машинного обучения, лежащие в основе рекомендательных систем, способны предсказывать желания человека лучше него самого

Так что если Вам чего-то хочется, но Вы сами не понимаете чего, скоро будет достаточно зайти в онлайн-магазин, которым Вы давно пользуетесь и он (точнее, рекомендательная система на его сайте) Вам подскажет.

Благодаря стремительному развитию методов машинного обучения, сильно меняется и современная математика, в которой появляются и начинают активно развиваться новые направления (например, стохастическая оптимизация, вероятностное моделирование и др.). По мере роста объемов доступной для анализа информации, растут и возможности методов машинного обучения. Наиболее успешные при работе с большими данными методы т.н. глубинного обучения (deep learning) во многих прикладных областях (распознавание речи, узнавание лиц, понимание изображений) уже обогнали возможности человеческого мозга. На очереди — задачи машинного перевода, понимания смысла текстов, автоматического управления автомобилем.

Инженеры компании Google анонсируют создание полноценного искусственного интеллекта в 2020-х годах. Появление такого инструмента может радикально изменить жизнь людей, значительно облегчив их интеллектуальный труд. Наконец-то машина сможет не только поднимать тяжести или штамповать детали, но и думать за человека. Через несколько лет мы узнаем насколько реалистичен этот прогноз. А пока Google переманивает из университетов коллективы исследователей в области глубинного обучения целыми лабораториями.