• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site
Article
Statistical testing of segment homogeneity in classification of piecewise-regular objects

Savchenko A., Belova N. S.

International Journal of Applied Mathematics and Computer Science. 2015. Vol. 25. No. 4. P. 915-925.

Article
Reconstruction of a word from a finite set of its subwords under the unit shift hypothesis. I. Reconstruction without for bidden words1

Smetanin Y., Ulyanov M.

Cybernetics and Systems Analysis. 2015. Vol. 50. No. 1. P. 148-156.

Article
VTMine Framework as Applied to Process Mining Modeling

Sergey Andreevich Shershakov.

International Journal of Computer and Communication Engineering. 2015. Vol. 4. No. 3. P. 166-179.

Natural Language Processing for Source Code

2022/2023
Academic Year
RUS
Instruction in Russian
10
ECTS credits
Type:
Elective course
When:
4 year, 1-3 module

Instructors

Булычев Егор Геннадьевич

Булычев Егор Геннадьевич

Малых Валентин Андреевич

Малых Валентин Андреевич

Программа дисциплины

Аннотация

Курс знакомит слушателя с современными методами обработки текстов, а также с их применением к текстам программ. Обработка текстов, как дисциплина, направлена на извлечение знаний из больших объемов текстов, а также на генерацию текстов для различных задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление с историей и современным развитием области NLP.
  • Овладение методами и средствами разработки для современных задач NLP
Планируемые результаты обучения

Планируемые результаты обучения

  • Овладение методами и средствами разработки для современных задач NLP
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Вводная
  • Основы машинного обучения
  • Векторные представления слов
  • Нейронные сети
  • Обработка последовательностей
  • Языковые модели
  • Тематическое моделирование
  • Машинный перевод
  • Предобученные языковые модели
  • Современные применения
Элементы контроля

Элементы контроля

  • неблокирующий Тесты (квизы) после лекции
    4 вопроса с 3 вариантами ответа. 1 балл за правильный ответ. Всего можно получить 10*4 = 40 баллов за тесты после лекций.
  • неблокирующий Домашнее задание
    Автоматическая оценка на платформе. 12 баллов за слабое решение, 25 баллов за сильное решение. Максимум можно получить 2 * 25 = 50 баллов за оба домашних задания.
  • неблокирующий Финальный проект
    Оценка преподавателем по 6 критериям. 55 баллов за проект, полностью соответствующий критериям.
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 1 модуль
    Оценка производится в третьем модуле.
  • 2022/2023 учебный год 3 модуль
    Расчёт оценки по дисциплине производится в два этапа. На первом этапе суммируются баллы, полученные за тесты, выполшение домашних заданий, а также финальный проект. Далее производится вычисление итоговой оценки по десятибалльной шкале в зависимости от набранного балла по следующему правилу: Сумма набранных баллов -> Оценка по десятибалльной шкале (по пятибалльной шкале); 0 -> 0 (неудовлетворительно); 1 - 20 -> 1 (неудовлетворительно); 21 - 40 -> 2 (неудовлетворительно); 41 - 60 -> 3 (неудовлетворительно); 61 - 80 -> 4 (удовлетворительно); 81 - 90 -> 5 (удовлетворительно); 91 - 100 -> 6 (хорошо); 100 - 115 -> 7 (хорошо); 116 - 125 - > 8 (отлично); 126 - 135 -> 9 (отлично); 136 - 145 -> 10 (отлично).
Список литературы

Список литературы

Рекомендуемая основная литература

  • Indurkhya N., Damerau F. J. Handbook of natural language processing. – Chapman and Hall/CRC, 2010. – 704 pp.

Рекомендуемая дополнительная литература

  • Поточняк, Я. (2012). Обработка Текстов И Сообщений На Естественном Языке В Информационных Системах.

Авторы

  • Мицюк Алексей Александрович
  • Петрухина Анастасия Сергеевна