Rambler's Top100
Статьи ИКС № 08-09 2013
Александра КРЫЛОВА  03 сентября 2013

Big Data: готовых решений нет

Несмотря на то что интерес к теме «больших данных» сегодня усиленно подогревается аналитиками и разработчиками BI-систем, не все потенциальные потребители понимают, почему необходимо инвестировать в эти отнюдь не дешевые продукты.

В чем аналитики сходятся, так это в перечне характерных признаков явления. Помимо значительных объемов, «большим данным» свойственны высокая скорость возникновения, сложность и несогласованность.

К Big Data может относиться как структурированная информация (в этом случае речь как раз идет об ее больших объемах), так и неструктурированная (комментарии пользователей в социальных сетях, их электронные письма и голосовые обращения в контактные центры, записи систем видеонаблюдения, действия, совершаемые абонентами со своих мобильных устройств). Кроме того, данные, попадающие в разряд «больших», можно условно разделить на внутренние, которые накапливаются в базах данных компании, и внешние, которые нужно агрегировать из множества разных источников.

Чаще всего с Big Data сталкиваются операторы связи, кредитные организации, учитывающие данные о настоящих и потенциальных клиентах в процессе скоринга для снижения кредитных рисков, торговые розничные сети, а также компании из других индустрий, которым для успеха в бизнесе необходимо собирать, хранить и анализировать информацию о своих клиентах, заказчиках и партнерах. При этом на каждом вертикальном рынке работа с «большими данными» имеет свою специфику.

Большие данные = персонализация сервиса

Для операторов связи и интернет-сервис-провайдеров, которые в силу высокой конкуренции и с коллегами по рынку, и с ОТТ-игроками вынуждены непрерывно искать новые способы удержания и «раскручивания» абонентов, работа с Big Data открывает возможность качественного улучшения клиентского опыта. Результаты оперативного анализа разнородных данных из систем OSS/BSS и других источников о действиях той или иной группы пользователей могут стать основанием для проявления к ней «проактивной заботы» со стороны оператора. Он, например, может обратиться к таким абонентам с персонализированным предложением, учитывающим контекст потребления ими услуг в режиме реального времени.

Сами абоненты, как показали данные опроса 3900 пользователей из разных стран мира, включая Россию, проведенного исследовательской компанией Coleman Parkers, в большинстве своем готовы делиться персональной информацией с сервис-провайдером, будучи уверены, что получат за это некую награду. В качестве таковой 65% респондентов предпочитают более выгодный тарифный план, 61% – повышенную скорость доступа в интернет, 54% – клиентское обслуживание вне очереди, а 50% – возможность «делить» один тарифный план между всеми своими устройствами. Кроме того, 44% опрошенных выразили заинтересованность в получении от провайдера денежного вознаграждения, еще 38% выбрали награды, предусмотренные программой лояльности. При этом 57% участников опроса подтвердили, что согласны сделать достоянием поставщика услуг не только данные о своем местонахождении и об истории своих заказов и ТВ-просмотров, но и информацию из социальных сетей, включая топ-5 друзей на Facebook, а также свои «лайки».

Любопытно, что на вопрос «готовы ли вы разрешить вашему сервис-провайдеру передавать данные о вас третьим сторонам?» отрицательный ответ дали только 46% абонентов. Оставшиеся 54% распределились следующим образом: 22% не возражают, если сведения будут передаваться в обезличенном виде, 20% предпочитают, чтобы у них спросили разрешения, а 12% согласились без всяких условий.

Аластер Хэнлон, глава подразделения Market Insight & Strategy компании Amdocs, на бизнес-форуме Amdocs In Touch-2013 отметил, что предоставление информации о потребительском поведении своих клиентов третьим сторонам, в роли которых могут выступать поставщики различных услуг, в том числе и компании из сегмента SMB, станет для операторов новым источником доходов.

Однако для этого сервис-провайдерам предстоит научиться обрабатывать огромное количество записей в базах данных своих систем, отбирая из них те, которые могут быть превращены в информацию для принятия разного рода решений – маркетинговых, технических, управленческих, – иными словами, полностью задействовать потенциал «больших данных», как внутренних из OSS/BSS, так и внешних. «Одна из проблем Big Data заключается в том, что в результате их анализа можно получить “все обо всем”, – поясняет Лев Ройтерштерн (Amdocs). – Для того чтобы выявлять важ ные тренды, требуется иметь в штате ученых, специализирующихся на обработке “больших данных”». Надо ли говорить, что пока такие специалисты, обладающие экспертизой в области именно телекоммуникационного рынка, встречаются достаточно редко? В этих условиях возможность передать функции фильтрации данных и поиска корреляции между ними на аутсорсинг, т.е. получать их в качестве профессиональных услуг, может показаться CIO операторских компаний довольно интересной. Она позволит им уйти от содержания в штате дорогостоящих экспертов в области «больших данных» и затрат на масштабный интеграционный проект по внедрению сложного программного решения. Одновременно они смогут предоставить своим коллегаммаркетологам инструменты, дающие возможность в режиме реального времени анализировать поведение пользователей, с высокой точностью (до 95%) выявлять тех из них, кто столкнулся с проблемами при обслуживании и подумывает об уходе, и с помощью всех доступных каналов коммуникаций принимать превентивные меры, направленные на удержание абонента. Так, по словам представителей «Ростелекома», сегодня в централизованной CRM-системе Amdocs в филиалах компании в Дальневосточном, Сибирском и Приволжском макрорегионах работают более 3 тыс. специалистов. В их числе сотрудники колл-центров, менеджеры офисов продаж, обслуживающие и частных, и корпоративных клиентов.

А в ближайшее время систему начнут использовать в повседневной работе специалисты «Ростелекома» еще из трех макрорегионов – Уральского, Южного и Северо-Западного. На вопрос «ИКС» о том, насколько в «Ростелекоме» заинтересованы в решениях для работы с большими данными, представители оператора ответили, что интерес есть, однако удовлетворить его сложно ввиду разрозненности информационных систем. По крайней мере, проект информационной системы по поддержке маркетинга с хранилищем данных, в котором применяются технологии data mining, продолжается третий год, но использовать результаты анализа в бизнес-процессах пока не удается. Даже в масштабе одного макрорегиона для того, чтобы проанализировать звонок абонента в колл-центр в режиме реального времени, требуются не только собственно хранилище данных, но и готовность платформ непрерывно такие данные в хранилище поставлять, и средства, обеспечивающие их визуализацию в клиентских приложениях.

Решение о кредите – на основе анализа соцсетей

«Какую отдачу я получу для бизнеса?» – ответом на этот вопрос посоветовал руководствоваться при принятии решения о начале работы с Big Data Мирча Михаэску Флорин (Центр технологических исследований Сбербанка) на конференции «Big Data Россия 2013», организованной Adam Smith Institute/Adam Smith Conferences в Москве. Чтобы найти такой ответ для себя, крупнейший российский банк начал пилотный проект с компаниями Accenture и Cloudera по сбору данных о его клиентах из внешних источников – популярных соцсетей – с последующим их анализом с точки зрения оценки рисков при принятии решения о выдаче кредита.

Впрочем, другие кредитные организации ставят под вопрос необходимость обогащения клиентского профиля неструктурированными данными из интернета.

Элиот Гойхман, CIO МДМ-Банка, объяснил свою позицию так: «Банки уже располагают большим объемом внутренних данных о клиентах, которые используют пока не очень эффективно». «Большие данные» о статусе клиента, его доходах и структуре расходов и даже о его передвижениях, содержащиеся в хранилищах внутрибанковских систем, могут служить основой для формирования спецпредложений, например, по фактам, которые свидетельствуют об изменении его образа жизни.

Банк «Тинькофф Кредитные Системы», работающий исключительно по виртуальной модели и обрабатывающий ежемесячно около 5 млн входящих и исходящих звонков, увидев, что имевшиеся традиционные BI-системы перестают успевать за темпами роста, сформулировал требования к новому решению. Помимо масштабируемости оно должно было быть недорогим и вендоронезависимым. Одновременно была осознана потребность в получении больших объемов данных в режиме реального времени, чтобы максимально быстро реагировать на происходящие изменения. После изучения рынка поставщиком была выбрана компания Attunity. В подтверждение работоспособности предложенного ею решения Вячеслав Цыганов, вицепрезидент и CIO банка «Тинькофф Кредитные Системы», привел одну цифру: ежедневно в банке производится 3 млрд операций – вставок в хранилище данных.

Компаниям, желающим пойти по этому же пути, В. Цыганов посоветовал присматриваться к решениям, в том числе с открытым кодом, которые приходят «снизу» и распространяются через профессиональное сообщество, а также изучать опыт «соседних» индустрий.

«Единый источник правды» и другие проекты

Ритейлеры, которые оперируют подробной информацией о тысячах производителей и поставщиков продукции, не менее объемными перечнями товарных позиций в ассортименте множества магазинов и складов, расположенных подчас далеко друг от друга, тоже уже начали использовать системы анализа Big Data для повышения эффективности своего бизнеса.

Так, BI-система National Speciality Retail компании Coca-Cola в США, обслуживающая более 2400 пользователей, еженедельно обрабатывает более 20 тыс. запросов на отчеты, а также информацию из социальных сетей о заказчиках ее продукции. Тем не менее Джастин Хономан, вице-президент подразделения Coca-Cola North American Group, признает: для того чтобы понять, что такое «большие данные», потребуется еще несколько лет.

Другой пример отлаженной работы с «большими данными» в торговой сети – Metro Cash & Carry, чье хранилище данных в России интегрирует информацию из различных внутренних информационных систем (финансовой, логистической, поддержки клиентов) и хранит ее в детализированном виде в течение трех лет.

К концу 2012 г. объем данных в этом хранилище составил 85 Тбайт. В прошлом году в системе было запущено 8,5 млн отчетов в интересах 16 тыс. пользователей из разных подразделений ритейлера. «Единым источником правды для компании» назвал ее Александр Борисов из Metro Cash & Carry, Россия. По его словам, система Big Data – это «живой организм», который развивается вместе с бизнесом.

Такие области, как общественный транспорт и безопасность, тоже могут выиграть от обработки «больших данных», считает Денис Сизов (Gartner). Единых подходов к решению этой задачи и технологий, которые нужно использовать, пока не выработано. Однако отдельные проекты по анализу Big Data в интересах обеспечения информационной безопасности уже реализованы. Один из них – подсистема ИБ в крупном государственном ведомстве (в каком именно, не раскрывается), позволяющая собирать и анализировать логи пользователей внутренних ИТ-ресурсов и на основании этого анализа находить ситуации, в которых их поведение отклонялось от стандартных сценариев. Такую систему на архитектуре, основанной на стеке IBM, создали для этого госзаказчика специалисты компании IBS. Также в активе системного интегратора проект для зарубежной компании по построению корпоративной социальной сети для взаимодействия сообществ практиков, система анализа госзакупок для распределенной федеральной госструктуры. Последняя позволяет осуществлять поиск и анализ данных, в том числе единичных цен, идентифицирует предметы контракта, а также обеспечивает формирование динамических досье субъектов закупок.

В случаях, требующих экспериментов и пилотных проектов, компаниям, собирающимся работать с «большими данными», может оказаться полезной тестовая лаборатория, в которой представлены наработки в области бизнес-аналитики крупных вендоров. Так, лаборатория IBS укомплектована решениями Oracle, SAP, DMH, IBM и лучшим достижением в области свободного ПО – технологией Hadoop.

* * *

Как признают многие эксперты, готовых решений, позволяющих разным бизнесам получить преимущества от анализа «больших данных», пока нет. Так что компаниям, прежде чем ввязываться в проект, предстоит понять, какие задачи они смогут решить с помощью Big Data, остановиться на тех или иных технологиях, которые для них подходят, и конечно же, сформулировать ожидания в отношении экономической эффективности проекта.

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!