• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Новости

Старший научный сотрудник МЛ ИССА Алексей Незнанов выступил на конференции "Качество данных 2020" 5 февраля 2020

Конференция «Качество данных 2020», организованная издательством «Открытые системы», показала невероятный интерес к весьма актуальной сегодня теме управления качеством данных.
Конференция собрала более 200 специалистов в области управления данными, которые вместе с ведущими экспертами обсудили методики и инструменты обеспечения, проблемы и метрики оценки качества, нюансы построения стратегии управления качеством данных, а также помехи на пути превращения корпоративных данных в бизнес-активы. 
Данные сегодня – ключевой фактор бизнеса, однако грязные данные не позволят предприятиям получить ожидаемых преимуществ. Как обеспечить качество данных в соответствии с целями их использования, гарантировав полноту, точность, корректность и актуальность?
Алексей Незнанов прочел доклад "Качество данных: стратегия, инструменты, практика".

Лучший убийца любого проекта анализа данных – «грязные» исходные данные. «Что посеешь — то и пожнешь», причем независимо от уровня проекта: применяются ли лучшие в индустрии алгоритмы, уточняются ли бизнес-правила или обучаются нейросети. Тем не менее, в подавляющем большинстве проектов теме управления качеством данных (DQM) уделяется преступно мало внимания. Формализация мастер-данных? Сквозное версионирование справочников? Аудит исторических данных? Стандарты оценки качество данных? Что вы! Не знаем, не делаем... 
В докладе рассматриваются возможности, подходы и стандарты, инструменты и лучшие практики управления качеством данных. От отдельных наборов и источников данных до гармонизации гетерогенных хранилищ данных. От прикладных онтологий до неструктурированных многоязычных текстов. От простейших реквизитов документов до систем иерархических метаданных. От ГОСТ Р 56214–2014 до определения качества больших данных. От корпоративных DQM-решений до сообществ «открытых данных» (Open Data). Особое внимание уделено методологии управления процессом принятия бизнес-решений на базе точных, полных, актуальных и проверяемых данных (DDDM). Кроме этого разбираются особенности реализации процессов сбора, анализа и интерпретации данных с обеспечением непрерывного улучшения их качества.

https://www.osp.ru/iz/dataquality2020/