Сервис описания изображений для незрячих людей

Выполнили: Коротков Антон Сергеевич, Курдун Мария Андреевна, Рябков Игорь Дмитриевич, Стамбеков Алмасбек Азатбекович

Данная работа посвящена подготовке моделей машинного обучения для создания сервиса, помогающего слабовидящим людям. Этот сервис описывает визуальный контент, с которым они сталкиваются в повседневной жизни, и предоставляет текстовые описания загружаемых изображений. Используются нейросетевые модели компьютерного зрения (CV) и обработки естественного языка (NLP). В частности, разработаны модели для детектирования и распознавания текста на изображениях, детектирования элементов интерфейса, определения возраста и пола людей на фотографиях, генерации описаний сцен, а также для классификации изображений на анимационные и реалистичные. Результаты моделей объединяются в текстовую аннотацию для дальнейшего озвучивания. Проект способствует продвижению цифровой инклюзивности, делая технологии доступнее для слабовидящих людей.

Запись защиты

Итоговый отчет (PDF, 14,57 Мб)

Презентация к защите (PDF, 4,32 Мб)

Ссылка на репозиторий на GitHub

Руководитель проекта

Рогачев Александр Игоревич

Департамент больших данных и информационного поиска: Преподаватель

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Центр практик, проектной работы и предпринимательства

Сервис описания изображений для незрячих людей

Выполнили: Коротков Антон Сергеевич, Курдун Мария Андреевна, Рябков Игорь Дмитриевич, Стамбеков Алмасбек Азатбекович

Запись защиты

Руководитель проекта