Rambler's Top100
Статьи ИКС № 05-06 2015
Дмитрий ШЕПЕЛЯВЫЙ  01 июня 2015

Аналитика на кончиках пальцев

О технологических вызовах и бизнес-трендах в работе с Big Data – Дмитрий ШЕПЕЛЯВЫЙ, заместитель гендиректора SAP СНГ.

Дмитрий ШЕПЕЛЯВЫЙ, заместитель гендиректора SAP СНГ.

Хранить научились, пора использовать

Тенденция, которую нельзя не отметить, – данных в компаниях накапливается все больше и они становятся все более разнообразными. Если раньше приходилось иметь дело с серьезными объемами структурированных данных, которые можно формализовать, то сейчас в хранилища поступают видеофайлы, показания датчиков, текстовые объекты и множество других данных всех возможных форматов.

Современные базы данных специализируются на решении какого-то одного класса задач, а интегрированных продуктов, умеющих делать все, на рынке немного. Однако такие продукты необходимы хотя бы в виртуальном слое, где на уровне представления нужно давать аналитическим инструментам возможность связаться со всеми источниками данных.

В чем преимущество использования Big Data и отличие современного подхода от предыдущего, требовавшего для работы с данными создания специального аналитического хранилища? В предыдущем поколении решений для того, чтобы выполнять анализ по прошлым периодам, данные загружались в хранилище, вычищались и агрегировались. При этом начальные данные терялись, а в хранилище оставались агрегаты, и на их основе строились отчеты. Понятно, что если требовался другой отчет, то исходных данных для него часто не было, поскольку они были уже вычищены.

Плюс же Big Data в том, что эти технологии позволяют хранить все данные. Цены на «железо», память, программное обеспечение, которое обрабатывает и анализирует данные, сейчас снижаются, так что можно хранить всю историю Facebook за все годы. Хранить можно все, и главное – все можно обрабатывать за разумное время.

Сегодня заказчики делают инвестиции в методологию, в алгоритмы предиктивной аналитики, поиск взаимосвязей между данными для того, чтобы эти данные стали действительно полезны для бизнеса. Пришло время убеждать владельцев и руководство компаний в пользе технологий и решений в области анализа «больших данных». В этом заключается основной бизнес-тренд.

Первые плоды

Доказывать свою точку зрения уже хорошо научились игроки рынка ритейла. Они все активней используют возможности next best offer – автоматического предложения следующего продукта на основании истории покупок и поведенческих моделей. Вторая индустрия, крупнейшие игроки которой учатся применять на благо бизнеса технологии анализа «больших данных», – это телеком. Операторам связи, сервис-провайдерам важно анализировать поведение абонентов, чтобы выявить среди них склонных к оттоку. Анализ данных, которые имеются в их распоряжении, позволяет по поведению абонента, по разговорам с ним, по его тратам предположить, что он собирается уйти к конкуренту, и понять, что ему можно предложить, чтобы его заинтересовать и удержать.

Таким образом, компании, работающие в массовом сегменте, учатся извлекать пользу из «больших данных» довольно быстро, хотя, конечно, косность маркетологов еще велика, причем не только в России. Но нам играет на руку наша экономическая ситуация, поскольку она требует повышения эффективности механизма продаж, а не просто покупки задорого большого количества новых клиентов. То есть отдача от конкретного абонента или покупателя становится гораздо важнее, чем их количество и продажи без прибыли. Иногда бывает выгодней не допустить оттока и «выжать» максимальный доход из имеющейся абонентской базы. Так что решения на базе «больших данных» сейчас востребованы, они на слуху, в работе. Словом, не было бы счастья, да несчастье помогло.

К тому же посчитать отдачу от таких бизнес-решений несложно. Ведь точное предсказание, каким будет отток абонентов в ближайшем месяце или квартале, позволяет увидеть, сколько средств мы можем сэкономить на привлечении новых клиентов. Есть маркетинг, есть агенты продаж, есть магазины, партнеры, которые продают, затраты на них понятны и рассчитываемы. И сокращение этих затрат, к примеру, на 10% – это конкретная цифра, так что оценить эффективность подобных решений несложно.

Интернет вещей станет локомотивом

В других индустриях, ориентированных на сегмент B2B, – промышленном производстве, энергетике, нефтегазовой отрасли и т.д. – извлекать пользу из Big Data начнут позднее, когда в свои права вступит интернет вещей. Когда на основании данных с датчиков, со станков, радиометок можно будет понять, насколько вероятен отказ того или иного оборудования. Тогда произойдет переход от планового ремонта к ремонту по состоянию, который выполняется до того, как какой-либо технологический узел – станок или машина – выйдет из строя.

Это гораздо дешевле, чем ждать плановой замены запчастей или поломки, на которую придется реагировать реактивно. Такой подход позволяет снизить запасы запчастей на складах. Если есть заранее составленная программа, указывающая, что и в какие сроки мы будем ремонтировать, можно не держать большие запасы дорогих запчастей, а заказывать их по необходимости. Основанием для этого служат результаты работы предиктивных алгоритмов, которые разработаны на базе статистики отказов, данных с датчиков, к примеру, температуры, давления, на основании умных моделей.

Разработчики активно готовятся к наступлению эры интернета вещей. Постепенно меняется модель данных в компаниях. Раньше, скажем, одна и та же информация в системах бухгалтерского, управленческого учета, данные по проводкам и изменения в счетах дублировались в разных таблицах. Сейчас эти таблицы сводятся воедино, экземпляр данных встречается один раз, и никакого дублирования нет. Вся транзакционная аналитическая система строится поверх этого слоя, что отменяет необходимость агрегатов и промежуточных таблиц.

В результате аналитика и бизнес-транзакции становятся ближе к первичным данным, устраняется необходимость промежуточных слоев, пакетных расчетов, агрегированных данных, которые были нужны из-за того, что технология традиционных баз данных не позволяла быстро получать доступ ко всей информации.

Новый подход может ускорить аналитику в десятки тысяч раз и в десятки раз снизить количество данных в системах. То есть в десятки раз меньше места потребуется для хранения информации. А это мощности ЦОДов, затраты на «железо», электричество, обслуживание, лицензии на операционные системы, из которых складывается общая стоимость владения.

С моей точки зрения, со временем необходимость в каких-то промежуточных прослойках между бизнесом и данными исчезнет, и финансовый директор не будет заказывать отчет своим аналитикам-айтишникам. Он просто возьмет планшет и кончиками пальцев добудет всю информацию о состоянии своего бизнеса в режиме реального времени. А аналитики будут заниматься разработкой панелей данных, моделей предиктивной аналитики, будут связывать данные между собой, т.е. выполнять интеллектуальную работу. 

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!