Статья сотрудников лаборатории представлена на конференции CVPR 2017
Одно из главных событий для сообщества компьютерного зрения - ежегодная конференция Computer Vision and Pattern Recognition. Публикации этой конференции являются наиболее высокоцитируемыми не только в области компьютерного зрения, но и по компьютерным наукам в целом. В последнее время фокус конференции сместился в сторону глубинного обучения, поскольку глубинные свёрточные нейронные сети стали основой большинства успешных методов компьютерного зрения.
В 2017 году конференция прошла с 21 по 26 июля в Гонолулу, США. В ней приняли участие около пяти тысяч человек (на 37% больше, чем в прошлом году). В основной секции конференции было представлено 783 работ (из 2620 поданных, доля принятых докладов 30%). В связи с огромным интересом к технологиям компьютерного зрения со стороны индустрии, в этом году почти удвоились спонсорские взносы компаний: они составили 859 тысяч долларов США. Среди спонсоров присутствовало большое число азиатских компаний, в первую очередь китайских. Из российских компаний в числе спонсоров присутствовала компания Яндекс.
В основной секции конференции был представлен постерный доклад научного сотрудника лаборатории Михаила Фигурнова. Работа Spatially Adaptive Computation Time for Residual Networks посвящена проблеме повышения вычислительной эффективности свёрточных нейронных сетей. Статья написана в соавторстве с исследователями Google, Carnegie Mellon University и Дмитрием Ветровым. Мотивацией для этой работы стало то, что использование современных глубинных нейросетей с сотней слоёв может быть избыточно, особенно для изображений, где большую площадь занимает неинформативный фон. В статье предложена новая архитектура глубинного обучения, которая учится пространственно адаптировать свою глубину. За счёт этого пиксели, существенные для решаемой задачи, обрабатываются всеми доступными слоями, а неинформативные пиксели - лишь несколькими слоями. Таким образом улучшается вычислительная эффективность модели. Доклад вызвал большой интерес посетителей конференции, в частности, представителей индустрии, для которых повышение скорости работы моделей является важнейшим требованием к разрабатываемым продуктам.
На конференции была представлена работа еще одного сотрудника ФКН, Артёма Бабенко: Product Split Trees. В ней рассматривается актуальная для поисковых систем задача приближённого поиска ближайшего соседа. Решение этой задачи требуется, к примеру, для реализации поиска по картинкам. В статье предлагается новый метод, показывающий лучшее соотношения скорости и качества по сравнению с предыдущими работами.