Сервис описания изображений для незрячих людей
Выполнили: Коротков Антон Сергеевич, Курдун Мария Андреевна, Рябков Игорь Дмитриевич, Стамбеков Алмасбек Азатбекович
Данная работа посвящена подготовке моделей машинного обучения для создания сервиса, помогающего слабовидящим людям. Этот сервис описывает визуальный контент, с которым они сталкиваются в повседневной жизни, и предоставляет текстовые описания загружаемых изображений. Используются нейросетевые модели компьютерного зрения (CV) и обработки естественного языка (NLP). В частности, разработаны модели для детектирования и распознавания текста на изображениях, детектирования элементов интерфейса, определения возраста и пола людей на фотографиях, генерации описаний сцен, а также для классификации изображений на анимационные и реалистичные. Результаты моделей объединяются в текстовую аннотацию для дальнейшего озвучивания. Проект способствует продвижению цифровой инклюзивности, делая технологии доступнее для слабовидящих людей.
Руководитель проекта
Департамент больших данных и информационного поиска: Преподаватель
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.