Как не потеряться в потоке данных

Главный технический директор WekaIO Энди Уотсон (Andy Watson) написал для Forbes статью о том, как современным компаниям извлечь максимум из доступных им данных. Самое главное — в нашем пересказе.

  • Вместе с большими данными появилось понятие data lake или «озеро данных». По сути это репозитарий, в котором хранится огромный объем сырых данных в первоначальном формате, пока они не будут затребованы. Их настолько много, что зачастую трудно найти что-то важное. Об этом хорошо свидетельствует тот факт, что 75% данных, хранящихся в организациях, никто никогда не анализируют и не использует (информация из отчета Forrester 2016 года).
  • В условиях возросшей глобальной конкуренции бизнес невозможен без стратегии работы с данными на основе искусственного интеллекта. Во многих компаниях есть отдельная должность директора по данным (Chief Data Officer). Такой сотрудник отвечает за состояние инфраструктуры данных, их получение из существующих источников и изучение новых. Образно можно сказать, что он исследует неизведанные участки «озера данных» и составляет его карту.
  • Правильное обращение с данными (поддержание адекватной инфраструктуры и работа с «озером данных») зачастую сокращает время вывода продукта на рынок, способствует более удачным исследованиям и повышает качество принятия решений.