• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 125319, г. Москва, 
Кочновский проезд, д. 3 (станция метро "Аэропорт").

Телефон: +7 (495) 772-95-90 *12332

Email: computerscience@hse.ru

 

Руководство

Декан Аржанцев Иван Владимирович

Первый заместитель декана Вознесенская Тамара Васильевна

Заместитель декана по научной работе и международному сотрудничеству Объедков Сергей Александрович

Заместитель декана по учебно-методической работе Самоненко Илья Юрьевич

Заместитель декана по развитию и административно-финансовой работе Плисецкая Ирина Александровна

Образовательные программы
Бакалаврская программа

Прикладная математика и информатика

4 года
Очная форма обучения
110/80/15
110 бюджетных мест
80 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Бакалаврская программа

Программа двух дипломов НИУ ВШЭ и Лондонского университета "Прикладной анализ данных"

4 года
Очная форма обучения
70/12
70 платных мест
12 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Бакалаврская программа

Программная инженерия

4 года
Очная форма обучения
80/70/15
80 бюджетных мест
70 платных мест
15 платных мест для иностранцев
RUS
Обучение ведётся на русском языке
Магистерская программа

Анализ данных в биологии и медицине

2 года
Очная форма обучения
15/5/2
15 бюджетных мест
5 платных мест
2 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Науки о данных

2 года
Очная форма обучения
55/15/6
55 бюджетных мест
15 платных мест
6 платных мест для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Магистерская программа

Системная и программная инженерия

2 года
Очная форма обучения
25/5/8
25 бюджетных мест
5 платных мест
8 платных мест для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Системное программирование

2 года
Очная форма обучения
15/5/2
15 бюджетных мест
5 платных мест
2 платных места для иностранцев
RUS
Обучение ведётся на русском языке
Магистерская программа

Статистическая теория обучения

2 года
Очная форма обучения
20/5/4
20 бюджетных мест
5 платных мест
4 платных места для иностранцев
ENG
Обучение ведётся на английском языке
Магистерская программа

Финансовые технологии и анализ данных

2 года
Очная форма обучения
35/3
35 платных мест
3 платных места для иностранцев
RUS/ENG
Обучение ведётся на русском и английском языках
Статья
Infinite transitivity, finite generation, and Demazure roots

Arzhantsev I., Kuyumzhiyan K., Zaidenberg M.

Advances in Mathematics. 2019. Vol. 351. P. 1-32.

Статья
Bias in False Discovery Rate Estimation in Mass-Spectrometry-Based Peptide Identification

Sulimov P., Voronkova A., Danilova Y. et al.

Journal of Proteome Research. 2019. Vol. 18. No. 5. P. 2354-2358.

Статья
Compression of recurrent neural networks for efficient language modeling

Grachev A., Ignatov D. I., Savchenko A.

Applied Soft Computing Journal. 2019. Vol. 79. P. 354-362.

Глава в книге
Numerical Pattern Mining Through Compression

Makhalova T., Kuznetsov S., Napoli A.

In bk.: 2019 Data Compression Conference Proceedings. IEEE, 2019.

Студент Вышки выступит на ACL — главной конференции по компьютерной лингвистике

Студент Вышки выступит на ACL — главной конференции по компьютерной лингвистике

© Коллекция Essentials/ iStock

Статья студента 4 курса факультета компьютерных наук Артема Гадецкого была принята на международную конференцию Association for Computational Linguistics — единственную конференцию по компьютерной лингвистике уровня A*.  Согласно системе CORE, которая ранжирует крупные конференции по computer science, конференции типа A* — это конференции высшего уровня.

Конференция ACL проводится ежегодно с 1962 года. На ней, как правило, представляют исследования, связанные с обработкой естественного языка: диалоговые системы, машинный перевод, различные генеративные модели текста. В среднем на конференцию принимают около 20% от поданных работ, в этом году из 1544 присланных работ было одобрено 384.

Научную работу Артем подготовил совместно с профессором факультета компьютерных наук Дмитрием Ветровым и Ильей Якубовским, исследователем компании Joom. Доклад на тему «Conditional Generators of Words Definitions» будет представлен на конференции, которая пройдет с 15 по 20 июля в Мельбурне (Австралия).

О статье

Часто в задачах машинного обучения в качестве данных выступает текст. Этот текст обычно разбивается на слова и затем преобразуется в вектор - набор чисел, с которым алгоритмам машинного обучения уже удобно работать. В работе Артема Гадецкого исследовались как раз такие векторные представления слов. Обычно для одного слова используется один вектор, но так как существуют многозначные слова, то неочевидно, что это представление хранит информацию о всех значениях слова. В работе была построена модель генерации определений слов. С ее помощью можно генерировать различные определения для разных значений одного и того же слова. За основу берется в данном случае пример употребления слова. Посмотрите, как это работает c простыми словами star, sentence, head:

 
СловоПример употребленияСгенерированное определение
starshe got star treatmenta person who is very important
starbright star in the skya small circle of a celestial object or planet that is seen in a circle
sentencesentence in prisonan act of restraining someone or something
sentencewrite up the sentencea piece of text written to be printed
headthe head of a manthe upper part of a human body
headthe leader of organizationwith the highest rank or position


Также в результате исследования было показано, что в одном таком представлении содержится информация о многих возможных смыслах. К тому же, есть основания полагать, что отдельные компоненты векторов слов могут отвечать за части речи и другие различные свойства слов.



Артем Гадецкий, студент 4 курса образовательной программы «Прикладная математика и информатика»

Построение интерпретируемых моделей является развивающейся и важной областью, так как полное понимание работы таких методов позволит найти недостатки и исправить их. Наша работа является шагом в сторону понимания того, что выучивают нейронные сети.


Дмитрий Ветров, заведующий Лабораторией компании Самсунг

Эта работа является прекрасным экспериментальным подтверждением того, что современные нейронные сети извлекают гораздо больше информации о данных, чем было принято считать. Нейронная сеть не просто понимает значения слов в зависимости от контекста, но и способна сформулировать свое понимание на человеческом языке. Это открывает новые возможности для построения интерпретируемых моделей искусственного интеллекта, когда нейронная сеть, помимо принятого решения, сразу генерирует текстовое описание, почему она приняла именно это решение. Технология, предложенная в нашей статье, представляет как конкретную практическую пользу, например, для финансовой сферы, так и более фундаментальную, показывая, что даже сравнительно примитивные (с точки зрения полноценного ИИ) технологии машинного обучения обладают неожиданными свойствами, традиционно приписываемыми высшей нервной деятельности. Это означает, что пройдена еще одна ступенька на пути к созданию полноценного искусственного разума.