Семинар НУЛ ИИВБ: "Utilizing empirical p-values in False Discovery Rate control and examination of the reasoning capacity of the deep net based METDR method".
В пятницу, 26 мая в 12:00 в рамках семинара на тему: «Utilizing empirical p-values in False Discovery Rate control and examination of the reasoning capacity of the deep net based METDR method», будут представлены два доклада.
Научно-учебная лаборатория искусственного интеллекта для вычислительной биологии: Стажер-исследователь
Искусственный интеллект был продемонстрирован как невероятно полезный инструмент для решения широкого круга задач. Одна из них — биоинформатика — предложила принципиально новые методики на стыке машинного обучения и статистики. Несмотря на свой потенциал, эти методы еще не использовались для более общих задач. Соответственно, в нашей работе мы разрабатываем радикально новый подход, называемый эмпирическими p-значениями (EPV). Предполагая, что отрицательные обучающие данные задачи классификации являются распределением нулевой гипотезы, мы вычисляем соответствующие p-значения для тестовых выборок. Позже мы расширяем процедуру BH для управления FDR, что позволяет как регулировать взаимосвязь распределений обучающих и тестовых данных, так и предсказывать новые метки на основе уже исследованных. Основная цель - точно предсказать количество принятых открытий на каждом уровне без истинных ярлыков.
студент 2 курса программы Науки о Данных факультета компьютерных наук
Задача ответов на вопросы по изображениям (VQA) имеет большое значение для искусственного интеллекта и требует использования комбинации визуальных и текстовых данных. Недавние успехи в области глубокого обучения, в том числе моделей на основе трансформеров, позволили достичь результатов, сравнимых с человеком. Тем не менее, все еще сложно объективно оценить способности модели к мышлению и пониманию отношений между объектами в реальном мире. В последнее время в задаче VQA появились большие наборы данных, которые требуют от моделей использования сложных визуальных и текстовых концепций. Целью данного исследования является создание нового датасета, который можно использовать для оценки моделей к сложному логическому мышлению, используя ограниченный набор визуальных и текстовых концепций, но при этом требующего комплексного понимания отношений между разными объектами. В этом исследовании представлена методология построения таких датасетов, а также описан код для Blender на языке Python. Также представлены результаты предобученной модели MDETR на предложенном датасете.