Студенты НИУ ВШЭ приняли участие в Moscow City Hack 2021
10-14 июня 2021 при поддержке Агентства инноваций Москвы прошел онлайн-хакатон по разработке цифровых решений и сервисов для города. Студенты, участвующие в хакатонах, ставят перед собой разные задачи: кто-то хочет победить, а для кого-то это возможность проверки гипотезы. В этот раз в хакатоне приняли участие две команды от клуба хакатонщиков, которые прошли предварительный отбор (из 114 команд было отобрано 7).
Рассказывает капитан первой команды ppnp.me Павел Крылов:
Недавно мы участвовали в Moscow City Hack от Агентства инноваций Москвы, где решали трек по рекомендации лучших локаций для бизнеса. Похожую задачу решает Локатор — сервис, который мы разрабатываем после хакатона Лидеры Цифровой Трансформации. Однако на Moscow City Hack нас ждал уникальный датасет — информация о подключениях к публичному Wi-Fi в центре Москвы.
В этот раз мы пошли на хакатон не за призом, а за проверкой гипотез и фидбэком от крутых менторов из ЭР-Телеком. За несколько месяцев работы над Локатором мы уже успели привыкнуть к задаче, поэтому смотреть на неё шире стало сложнее.
Moscow City Hack проходил в горячее время подготовки к сессии, поэтому нам пришлось немного обновить состав команды: к нам присоединились Никита и Иван.
Мы собрались всей командой в оффлайне и погрузились в непрерывный брейншторм и разработку — четыре дня хакатона пролетели как один. По результатам хакатона мы заняли 4 место, но получили самое главное: десяток идей и инсайтов. Опытные специалисты ЭР-Телекома направили нас в нужное русло и выразили искренний интерес к нашему решению — это лучшая мотивация продолжать работу над созданием продукта после хакатона.
Иван подробнее расскажет про Data Science в нашем решении.
Иван Мошков:
На хакатоне организаторы предоставили данные общественных Wi-Fi точек в южной части Москвы внутри Садового кольца за март, апрель и май. Каждая строчка таблицы — одна пользовательская сессия, которая содержит точное время начала и конца подключения к конкретной точке. Также известны координаты самой Wi-Fi точки и для некоторых сессий — id пользователя.
Что можно извлечь из этих данных? Первое, что приходит на ум — посчитать “проходимость” для каждой точки, то есть число подключений. После этого можно агрегировать их, например, по часам или дням недели и построить графики активности пользователей: как часто в данном месте бывают люди в то или иное время.
Вторая идея — можно посчитать количество уникальных посетителей конкретной точки, ведь нам известны идентификаторы пользователей. Далее результат делим на общее число подключений к точке и получаем коэффициент, который показывает retention людей в точку за некоторый период времени. Из этого тоже можно сделать выводы: если в место часто возвращаются одни и те же люди, значит оно находится рядом, например, с ВУЗом либо офисным центром. А если редко — значит это просто пешеходная улица.
Посчитанную статистику можно отобразить в интерфейсе приложения на карточке конкретной локации в виде графиков. Также эти данные идут в качестве фичей для модели машинного обучения.
Разумеется, только этими данными все не обошлось, и мы использовали множество дополнительных. Например, чтобы разметить предоставленный датасет мы обратились к открытым данным по торговым точкам Москвы. Дополнительно мы использовали и другие таблицы с Портала открытых данных Правительства Москвы (data.mos.ru): данные по общественному транспорту, парковкам, сдающимся в аренду помещениям, инфраструктуре, стоимости жилья и другие.
После подготовки и разметки данных нужно сделать самое важное — построить модель, предсказывающую рейтинг локации для конкретного вида бизнеса. Идея простая и красивая: для каждого здания нужно понять, бизнесы каких типов в нем открыты. Далее по собранным данным посчитать признаки: количество станций метро в радиусе Х, расстояние до ближайшей булочной, логарифм количества лежачих полицейских во дворе и прочее. Вот у нас и получился датасет: для каждого здания знаем фичи и таргеты. После этого наконец-то можно обучить модель.
Почему же это работает? Согласно концепции“Wisdom of the crowd”, обычно люди принимают правильные решения. Конечно, один предприниматель может открыть кафе в неподходящем месте, но в масштабах целого города кафе скорее расположены в подходящих для этого местах, нежели в неподходящих. В результате мы объединили уникальную информацию ЭР-Телекома, открытые данные Москвы и мудрость столичных предпринимателей и смогли создать прототип сервиса, упрощающего жизнь начинающих предпринимателей.
Вторая команда была представлена студентами Факультета Дизайна НИУ ВШЭ, участниками Клуба хакатонщиков ФКН. Капитан команды Елизавета Андреянова делится с нами: «А вы задумывались о том, что мы живем в большом информационном пространстве и мозг не успевает перерабатывать информацию, от этого мы чувствуем усталость и снижение мотивации? Одним из каналов поступления информации являются социальные сети и мессенджеры. Сколько приложений установлено у Вас? Да, ответ минимум 4-5. Потому как здесь звонить удобно, конференции запускать, здесь посты интересные изучить, здесь фотографии без потери качества, а здесь безопасно и без рекламы. Это сколько же надо сделать действий нашему мозгу, чтобы обработать все это. Уже к вечеру мы не можем заснуть, а утром состояние как-будто и не спали».
Команда Елизаветы решала задачу по разработке открытой платформы для мгновенного обмена сообщениями SBERCLOUD. Необходимо было создать такой продукт, который соединил бы задачи бизнеса, легкость и удобство использования в личных целях. ⠀
Капитан команды Елизавета рассказала нам, что они заявили перед инвесторами в финале хакатона: ⠀
Мы разработали структурную архитектуру решения, создали прототип экологичного многозадачного мессенджера для друзей. ⠀
Мессенджер "СКРЕПКА SBERCLOUD"- удобная экосистема, которая соединяет стандартный набор инструментов коммуникации и максимально простую, комфортную платформу в решении повседневных личных задач и задач бизнеса. Мы использовали открытое событийное API для легкой интеграции в различные системы, end to end шифрование для безопасности и интерфейс с agile подходом, исключающий перегрузку мозга излишним визуалом, и ненавязчивые сторонние сервисы для повседневной жизни. ⠀
Для того, чтобы определить Feature платформы мы провели огромный анализ рынка мессенджеров, карты трендов будущего, сделав акцент на азиатский рынок, так как именно он сейчас по нашему мнению задает темп.
Невероятно здорово, что наши студенты строят свое будущее своими руками и в этом огромная сила и мощь!
А ты влияешь на свое Будущее?
⠀