• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 125319, г. Москва, 
Кочновский проезд, д. 3 (станция метро "Аэропорт").

Телефон: +7 (495) 772-95-90 *12332

Email: computerscience@hse.ru

 

Руководство

Декан Аржанцев Иван Владимирович

Первый заместитель декана Вознесенская Тамара Васильевна

Заместитель декана по научной работе и международному сотрудничеству Объедков Сергей Александрович

Заместитель декана по учебно-методической работе Самоненко Илья Юрьевич

Заместитель декана по развитию и административно-финансовой работе Плисецкая Ирина Александровна

Мероприятия
17 июня – 22 июня
Ранняя регистрация: до 15 апреля Закрытие регистрации: 15 мая 
1 июля – 10 июля
Прием заявок — до 21 апреля 
26 августа – 6 сентября
Регистрация – до 12 мая 
26 августа – 30 августа
Registration and Poster Submission deadline — May 1, 2019 
Образовательные программы
Бакалаврская программа

Прикладная математика и информатика

4 года
Очная форма обучения
110/80/15
110 бюджетных мест
80 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Бакалаврская программа

Программа двух дипломов НИУ ВШЭ и Лондонского университета "Прикладной анализ данных"

4 года
Очная форма обучения
70/12
70 платных мест
12 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Бакалаврская программа

Программная инженерия

4 года
Очная форма обучения
80/70/15
80 бюджетных мест
70 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Магистерская программа

Анализ данных в биологии и медицине

2 года
Очная форма обучения
15/5/2
15 бюджетных мест
5 платных мест
2 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Науки о данных

2 года
Очная форма обучения
55/15/6
55 бюджетных мест
15 платных мест
6 платных мест для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Системная и программная инженерия

2 года
Очная форма обучения
25/5/8
25 бюджетных мест
5 платных мест
8 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Системное программирование

2 года
Очная форма обучения
15/5/2
15 бюджетных мест
5 платных мест
2 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Статистическая теория обучения

2 года
Очная форма обучения
20/5/4
20 бюджетных мест
5 платных мест
4 платных места для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Финансовые технологии и анализ данных

2 года
Очная форма обучения
35/3
35 платных мест
3 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Статья
On the prediction loss of the lasso in the partially labeled setting

Bellec P., Dalalyan A., Grappin E. et al.

Electronic journal of statistics. 2018. Vol. 12. No. 2. P. 3443-3472.

Статья
On the Structure of Ammann A2 Tilings
В печати

Durand B., Shen A., Vereshchagin N.

Discrete and Computational Geometry. 2019. P. 1-30.

Статья
Ontology–based access to temporal data with ontop: a framework proposal

Zakharyaschev M. et al.

International Journal of Applied Mathematics and Computer Science. 2019. Vol. 29. No. 1. P. 17-30.

Как научить машину предсказывать желания человека

Возможности машинного обучения позволяют прогнозировать появление искусственного интеллекта уже через несколько лет. Об этом рассказывает руководитель департамента больших данных и информационного поиска факультета компьютерных наук ВШЭ Дмитрий Ветров. Статья является частью совместного проекта Forbes и сайта «Постнаука».

Машинное обучение — это область математики, которая занимается поиском скрытых закономерностей в тех данных, которыми оперирует компьютер. Под «данными» в традиционной математике понимается некая совокупность объектов. На практике в  качестве объектов могут выступать, например, пользователи социальной сети, изображения, клиенты банков, страны, РНК, результаты экспериментов с Большого адронного коллайдера и так далее. Единственное требование, предъявляемое математикой к объекту, заключается в том, что он должен быть описан некоторой совокупностью переменных, которые, собственно, его характеризуют.

Машинное обучение начинается в тот момент, когда переменные, которыми описывается объект, становится возможным поделить на две части: наблюдаемые и скрытые (латентные) переменные. Наблюдаемые — это те, которые мы можем измерить у любого из всей совокупности объектов. Скрытые же, или латентные переменные, мы можем измерить у ограниченного количества объектов, потому что, как правило, их измерение сопряжено с какими-либо затратами (финансовыми, временными, и пр.). При этом предполагается, что между наблюдаемыми и скрытыми переменными есть некоторая взаимосвязь.

 На поиск этой взаимосвязи и направлены современные алгоритмы машинного обучения

В тех случаях, когда существуют известные математические модели, увязывающие наблюдаемые и скрытые компоненты в общие уравнения, в машинном обучении нет необходимости. Однако большинство задач, которые возникают в реальности, как правило, связаны с анализом данных (явлений), для которых, ни физических, ни математических моделей, в настоящее время, не существует, но зато можно собрать достаточно большую обучающую выборку.

Обучающая выборка — это совокупность объектов, для которых известны и наблюдаемые, и скрытые компоненты. Задача алгоритма машинного обучения —  анализируя обучающую выборку, приближенно восстановить взаимосвязь между наблюдаемыми и скрытыми компонентами, с помощью которой можно было бы прогнозировать значения скрытых компонент.

 Классический пример — это банковский кредитный скоринг

Предположим, вы — банкир, и у вас есть клиенты, которые очень хотят получить кредит. Кто-то собирается открыть свое дело, а кому-то кредит нужен, чтобы купить ящик водки и выпить ее. Возникает вопрос: кому кредит выдавать можно, а кому лучше не выдавать, потому что он его не вернет. Здесь в качестве наблюдаемых переменных у нас выступают характеристики клиентов. Например, те данные, которые они указывают в анкетах: пол, возраст, образование, уровень доходов, состав семьи и так далее. В качестве скрытой компоненты в простейшем случае выступает бинарная величина — вернет клиент кредит или не вернет. Если он его вернет, то имеет смысл ему этот кредит выдать.

В более сложных расчетах риск невозврата кредита оценивается как вероятность, с которой кредит может не быть возвращен. В этом случае создаются более сложные экономические модели принятия решения, когда лучше выдавать кредит.

Предположим, у нас было 400 клиентов, из которых, 350 вернули кредит. Это пример объектов, у которых скрытая компонента имеет значение +1; а 50 клиентов, которые, как оказалось, кредит не вернули — это примеры объектов со скрытой компонентой, которая приняла значение -1. В принципе, этого достаточно для того, чтобы ставить задачу машинного обучения и пытаться автоматически находить закономерности между наблюдаемыми и скрытыми компонентами в надежде, что они помогут нам определить, каким новым клиентам стоит выдавать кредит, а каким — нет.

В настоящее время дополнительный импульс развитию методов машинного обучения придал интернет и появившиеся новые технологии. Например, поисковые системы, социальные сети, блогосфера, биоинформатика. Задачи, возникающие в этих предметных областях, часто требуют применения современных методов машинного обучения. Именно поэтому в настоящее время в мире наблюдается растущий спрос на специалистов машинного обучения: они нужны в биологических лабораториях, компаниях -ритейлерах, в инвестиционных банках, а также в интернет-компаниях, в том числе таких, как Facebook, Google, Yandex.

 С помощью алгоритмов машинного обучения можно развивать персонифицированные сервисы

Например, когда мы вводим запрос в поисковую систему, она анализирует наше поведение — на какие ссылки мы кликаем, сколько секунд проводим, изучая результаты поиска, как управляем курсором мыши. Собираемая информация используется для корректировки результатов выдачи наших будущих поисковых запросов, так, чтобы в начале списка были те ресурсы, которые именно мы, а не компьютер, считаем наиболее релевантными. Именно поэтому так сложно переходить с привычной поисковой системы на новую — она еще не знает наших склонностей и предпочтений и выдает по нашим запросам наиболее релевантные ссылки с точки зрения поисковой системы, без адаптации под наши индивидуальные вкусы.

Похожие задачи возникают в социальных сетях, например, если требуется решить, каким пользователям какие рекламные баннеры демонстрировать. Ведь полезную рекламу мы воспринимаем как само собой разумеющееся, а бесполезная реклама раздражает. Возникает естественная задача отображать конкретному пользователю те баннеры, которые рекламируют товары, к приобретению которых он морально готов. В ближайшие годы, аналогичные технологии избирательного рекламного действия появятся и на телевидении. Тогда в перерыве футбольного матча Вы будете видеть рекламу чипсов, а Ваш пожилой сосед — рекламу средства от ревматизма.

По похожим принципам устроены так называемые рекомендательные сервисы. Они стали особенно востребованы с развитием интернет-коммерции. Когда мы заходим в интернет-магазин, наименования которого составляют сотни тысяч товаров, мы физически не в состоянии просмотреть все товары. Естественно, интернет-магазин заинтересован в том, чтобы показывать пользователю те товары, которые он с большей вероятностью купит. И  для того, чтобы такие товары определить, необходимо построить рекомендательную систему, которая рекомендовала бы тот или иной товар, базируясь на нашей истории покупок и истории покупок других пользователей, чьи вкусы система читает близкими к нашим. Методы для построения таких систем породили целый раздел в машинном обучении — так называемую «коллаборативную фильтрацию». Специалисты по коллаборативной фильтрации (в настоящее время в России их буквально по пальцам можно пересчитать) пользуются сейчас очень большим спросом.

 

 Современные алгоритмы машинного обучения, лежащие в основе рекомендательных систем, способны предсказывать желания человека лучше него самого

Так что если Вам чего-то хочется, но Вы сами не понимаете чего, скоро будет достаточно зайти в онлайн-магазин, которым Вы давно пользуетесь и он (точнее, рекомендательная система на его сайте) Вам подскажет.

Благодаря стремительному развитию методов машинного обучения, сильно меняется и современная математика, в которой появляются и начинают активно развиваться новые направления (например, стохастическая оптимизация, вероятностное моделирование и др.). По мере роста объемов доступной для анализа информации, растут и возможности методов машинного обучения. Наиболее успешные при работе с большими данными методы т.н. глубинного обучения (deep learning) во многих прикладных областях (распознавание речи, узнавание лиц, понимание изображений) уже обогнали возможности человеческого мозга. На очереди — задачи машинного перевода, понимания смысла текстов, автоматического управления автомобилем.

Инженеры компании Google анонсируют создание полноценного искусственного интеллекта в 2020-х годах. Появление такого инструмента может радикально изменить жизнь людей, значительно облегчив их интеллектуальный труд. Наконец-то машина сможет не только поднимать тяжести или штамповать детали, но и думать за человека. Через несколько лет мы узнаем насколько реалистичен этот прогноз. А пока Google переманивает из университетов коллективы исследователей в области глубинного обучения целыми лабораториями.