Ученые Центра ИИ выступили с докладом на конференции CORE A*
В статье Rehabilitating Homeless: Dataset and Key Insights показан большой анонимный набор данных о бездомности с информацией о реабилитации бездомных людей. Набор данных состоит из более чем шести тысяч записей. Данные для исследования предоставила крупная некоммерческая организация «Ночлежка», которая занимается помощью бездомным людям уже более тридцати лет. Данные анонимизированы, но содержат много деталей о каждом клиенте. Эти детали необходимы для понимания различных факторов, влияющих на успех реабилитации.
«Это первый известный нам набор данных, который содержит обширную информацию о тысячах бездомных людей, нуждающихся в реабилитации, — рассказывает Анна Быкова, аналитик Лаборатории естественного языка ВШЭ — Яндекс. — Мы показываем, как анализ данных может помочь сделать процесс реабилитации более эффективным и успешным. Мы надеемся, что предоставленный набор данных будет полезен для сообщества специалистов, неравнодушных к данной проблеме».
Больше года ученые Лаборатории естественного языка ВШЭ — Яндекс в рамках проекта Центра ИИ применяли методы машинного обучения для изучения вопросов реабилитации бездомных людей. Показано, что можно прогнозировать вероятность реабилитации с точностью до 80 % и более.
Набор данных опубликован для дальнейшего исследования. Результаты, полученные в рамках проекта, планируется использовать в работе «Ночлежки». Публикация этих социально важных данных может привлечь внимание сообщества специалистов к проблеме бездомности, которую необходимо решать.
Исследования стали возможны благодаря финансовой поддержке индустриального партнера Яндекс.