О школе

Занятия рассчитаны на аудиторию, знакомую с базовой теорией Deep Learning (нейронные сети, градиенты, оптимизаторы) и NLP (статистические подходы, RNN, токенизация текста).

Курс состоит из 8 лекций, которые включают в себя введение в область, теорию вокруг современных подходов к обучению и применению LLM, а также интеграция их в продукты и общение с бизнесом.

По окончании школы, участники реализуют проект и защищают его перед экспертами компании VK.

Программа

  • 1 июля

    10:00-10:20 Регистрация участников

    Ауд. R306

    10:20-10:35 Кто мы такие, о чем курс, и чем займемся

    Правила игры, как его закончить и что ждет успешные команды.

    Спикер: Андрей Соколов
    Ауд. R306

    10:35-12:05 Введение в языковое моделирование: от N-Gram до GPT-like подходов

    Задача языкового моделирования, авторегрессивность, эволюция подходов к решению, метрики. Pre-train & Fine-tuning (перенос на суммаризацию, машинный перевод), Language Models are Few-Shot Learners.

    Спикер: Андрей Соколов
    Ауд. R306

    12:05 - 13:35 Transformers and beyond

    Как эволюционировали трансформеры, какие сейчас модификации использовались. Вариации механизма внимания, позиционных эмбеддингов, feed-forward блока. Оптимизации обучения (flash-attention, xformers).

    Спикер: Егор Спирин
    Ауд. R306

    13:35 - 15:05 Alignment

    First stage — sft, second stage — DPO/RLHF, стратегии сбора данных, существующие бенчмарки и подходы к оцениванию.

    Спикер: Кирилл Семин
    Ауд. R306

    15:05 - 16:00 Пицца, нетворкинг

    Ауд. R306

    Практическая часть

    Выбор проектов, обсуждение тем проектов и технологий, вопросы по лекциям.
    Ауд. R603, R609, R610, R614

  • 2 июля

    10:00 - 11:30 Масштабирование языковых моделей

    Что делать, когда 1 или даже 8 GPU недостаточно. Распределенное обучение, методы параллелизации обучения, шардирование, CPU Offloading, gradient activation, fused kernels.

    Спикер: Егор Спирин
    Ауд. R306

    11:30 - 13:00 Low-resource LM: от обучения до инференса

    PEFT (LORA, DORA, …), квантизация (gptq, …), kv-caching, paged memory attention (VLLM), p-tune.

    Спикер: Кирилл Семин
    Ауд. R306

    13:00 - 14:30 RAG, агенты и другие способы расширить способности LLM

    1. RAG, семантические энкодеры и векторный поиск, knowledge maps/graphs
    2. CoT, prompt engineering etc
    3. LLM Agents: Memory, Planning, Tooling

    Спикер: Антон Земеров
    Ауд. R306

    14:30 - 15:00 Пицца, нетворкинг

    Ауд. R306

    Практическая часть

    Выбор проектов, тестирование, проверка работ, отбор в проекты участников, информирование.
    Ауд.R603, R609, R610, R614

  • 3 июля

    10:00 - 11:30 Зачем бизнесу LLM и когда нужно учить ее с нуля

    Спикер: Иван Самсонов
    Ауд. R306

    11:30 - 14:00 Консультации команд по технологиям и продукту

    Ауд. R306

    14:00 - 15:00 Пицца, нетворкинг

    Ауд. R306

  • 4 июля

    10:00 - 11:30 Разбор реальных use-case применения LLM в различных стартапах, продуктах

    Спикер: Михаил Хаджинов
    Ауд. R306

    11:30 - 14:00 Консультации команд по технологиям и продукту

    Ауд. R306

    14:00 - 15:00 Пицца, нетворкинг

    Ауд. R306

  • 5 июля

    Защита проектов. Награждение (в офисе VK).

    10:00 - 10:30 Регистрация участников. Приветственный кофе
    10:30 - 14:30 Защита проектов
    14:30 - 15:30 Работа жюри, кофе-брейк для участников
    15:30 - 16:00 Награждение победителей

Спикеры

Антон Земеров

Старший программист NLP ВКонтакте

Иван Самсонов

Руководитель группы прикладных исследований ВКонтакте

Кирилл Семин

Старший программист NLP ВКонтакте

Андрей Соколов

Руководитель команды NLP ВКонтакте

Егор Спирин

Старший программист NLP ВКонтакте

Михаил Хаджинов

Менеджер продукта в группе прикладных исследований ВКонтакте

Партнёр школы

Q&A

Как будет проходить школа?

Летняя школа будет проходить в очном формате в здании НИУ ВШЭ по адресу: Покровский бульвар, 11. Финальная защита проектов пройдет в офисе VK Скайлайт

Является ли участие в школе платным?

Участие в нашей школе бесплатное, но количество мест ограничено.

Для кого предназначена школа?

Для студентов 2-4 курсов бакалавриата факультета компьютерных наук НИУ ВШЭ.

У меня остались вопросы по поводу моего участия в Летней школе, куда мне обратиться, чтобы найти на них ответы?

Мы с радостью ответим на все ваши вопросы! Пишите нам на nopanasenko@hse.ru.

Контакты

Тelegram: nina332122
Почта: nopanasenko@hse.ru