Rambler's Top100
Статьи
18 декабря 2013

Жизнь в эпоху «больших данных»

Интервью с Бобом Пламриджем, директором по технологиям HDS, регион EMEA.

Боб ПламриджИКС:  В каком состоянии сейчас находится рынок систем анализа и обработки Big Data? Об этом много говорят, но какова ситуация, если посмотреть глазами эксперта?

Боб Пламридж: Рынок Big Data сейчас находится на самом раннем этапе своего развития. Уже есть примеры внедрений, причем в разных отраслях – транспорт, медицина, связь и т.д., но это все небольшие системы. Думаю, дело в том, что сейчас, на начальном этапе, заказчики хотят видеть степень сложности систем, иметь возможность оценить затраты и выгоду от внедрений.

Основная задача на данном этапе развития рынка – именно оценка выгоды от внедрения, поэтому, очень важно, когда движущей силой в проекте по запуску системы анализа «больших данных» становится бизнес, а не ИТ-специалисты. Именно бизнес может лучше оценить экономические выгоды, которые обеспечивает такая система.

- Проблемой для обработки и анализа обычно называют неструктурированные данные. Как обстоят дела с ними?

- Проблема, действительно, существует, но я думаю, что ее удастся решить с помощью объектных хранилищ. Их основная особенность в том, что они дают нам возможность работать не с данными как таковыми, а с метаданными. На входе мы получаем много файлов-источников в различных форматах, а затем гармонизируем данные, в результате чего появляется возможность быстрого анализа, которую дают нам метаданные, а при необходимости, в каком-либо конкретном случае, мы уже можем спуститься на уровень того или иного файла. Я думаю, что именно с метаданными будут работать решения по анализу и обработке «больших данных», и эта технология снимает вопрос о том, структурированы они или нет.

- В то время как компании и государственные организации присматриваются к Big Data, простые граждане все чаще говорят о боязни тотального контроля, слежки. Насколько обоснованы такие страхи?

- Нельзя сказать, что эти страхи беспочвенны. Действительно, чем больше накапливается данных о каждом человеке, тем прозрачнее становится личная жизнь, тем сложнее сохранить ее тайну. Если государственные органы научатся обрабатывать данные о человеке, поступающие из разных источников, они будут знать о каждом из нас больше, чем мы сами.

Например, в Великобритании всюду установлены устройства, считывающие номера машин. Представляете, что будет, если все поступающие с них данные будут обрабатываться и анализироваться? О передвижениях любого автомобилиста будут знать буквально все!

И ровно тот же самый вопрос возникает по отношению, скажем, к крупным Интернет-провайдерам. Если они будут обрабатывать и анализировать всю информацию, которая  через них передается и частично хранится, они будут знать о нас слишком много!

Безусловно, проблемы защиты личной жизни и частной информации с ростом объемов информации выходят на первый план.

Сейчас в Евросоюзе на законодательном уровне обсуждается вопрос о том, имеет ли человек право на то, чтобы его забыли. Может ли он, например, обратиться к своему провайдеру с просьбой удалить данные о себе, хранящиеся у него? Ориентировочно,  этот законопроект должен быть принят уже весной 2014 года. Конечно, в нем будут оговорки, потому что есть организации, которые по закону должны какое-то время хранить определенные данные о людях. Те же больницы, банки или полиция, но в целом должен быть какой-то законодательный механизм для того, чтобы каждый человек мог сократить количество хранящейся о нем информации.

-Не значит ли это, что важными в современном мире становятся вопросы доверия? Может ли человек верить в то, что его данные действительно будут удалены? Информационные скандалы последних лет делают этот вопрос очень актуальным.

- Конечно, чудес не бывает, и всегда будут те, кто должен был бы уничтожить данные, но по какой-то причине забыл или сознательно не сделал этого. Это так, и с этим ничего не поделаешь, но нам важно иметь некоторый законодательный механизм, который будет регулировать отношения в мире «больших данных». Это нужно для того, чтобы было, на что опираться.

Но надо понимать, что с исполнением закона и его нюансами будет связано еще немало проблем, зависящих от законодательства конкретной страны. Например, с развитием облачных сервисов в Европе ситуация неравномерная, а все потому, что британские компании, работающие на территории Великобритании, например, могут хранить данные где угодно, а французские, работающие во Франции, обязаны хранить свои данные только в своей стране. Конечно, это налагает определенные ограничения.

- Периметр систем инфобезопасности для компаний все время расширяется. Сначала из-за Интернета, теперь из-за мобильности и явлений типа BYOD. Как изменятся стратегии информационной безопасности с использованием BD?

- Именно сильное расширение границ периметра безопасности, как мне кажется, является барьером для внедрения облачных технологий. Мы видим, что основная масса проектов, которые сейчас реализуются на рынке, связана с использованием частных облаков, а не публичных. Так проще и понятнее, что именно мы хотим защитить - есть фаервол, есть какой-то зримый, осязаемый периметр, где заканчивается «свое» и начинается «чужое». 

В связи с «большими данными» проблем, конечно, станет еще больше, и не только для пользователей, о чем мы уже говорили, но и для самих компаний. Как хранить много данных о своих пользователях, скажем, банку, и как передавать их другим системам?

Мне кажется, что трендом будет деперсонализация данных. То есть, передавая данные из системы в систему, мы не сможем связать тот или иной набор параметров с конкретным человеком.

Будет несколько уровней хранения информации и работы с ней. Скажем, внутри своего периметра какой-либо банк будет хранить не обезличенные данные пользователей, чтобы иметь возможность предлагать персонализированные услуги, однако, дальнейшая передача данных уже будет сопряжена с деперсонализацией. И именно в таком виде их будут хранить.

- И, наконец, как, на ваш взгляд, изменится рынок ИТ в целом с массовым использованием больших данных?

- Если использовать наши устройства, то рынок изменится в лучшую сторону (улыбается). А если серьезно, то я уверен, что в ближайшие 5-10 лет в целом будет решена задача анализа «больших данных», этот процесс станет привычным, простым и быстрым. И, возможно, решаться он будет не на уровне приложений, а еще на уровне хранения.

Анализ «больших данных» будет происходить в режиме реального времени , мы научимся делать это налету, без предварительного сохранения. Система будет работать по «замкнутому контуру»: поступление данных и их обработка будут происходить постоянно, и этот процесс будет последовательным.

И, наконец, в течение пяти лет организация объектных хранилищ (хранилищ метаданных, о которых я уже говорил) станет доминирующей технологией на рынке. Это очень удобно и, значит, будет востребовано.

Беседовала Екатерина Шлык

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!