Рубрикатор |
Статьи |
18 декабря 2013 |
Жизнь в эпоху «больших данных»
Интервью с Бобом Пламриджем, директором по технологиям HDS, регион EMEA.
ИКС: В каком состоянии сейчас находится рынок систем анализа и обработки Big Data? Об этом много говорят, но какова ситуация, если посмотреть глазами эксперта?
Боб Пламридж: Рынок Big Data сейчас находится на самом раннем этапе своего развития. Уже есть примеры внедрений, причем в разных отраслях – транспорт, медицина, связь и т.д., но это все небольшие системы. Думаю, дело в том, что сейчас, на начальном этапе, заказчики хотят видеть степень сложности систем, иметь возможность оценить затраты и выгоду от внедрений.
Основная задача на данном этапе развития рынка – именно оценка выгоды от внедрения, поэтому, очень важно, когда движущей силой в проекте по запуску системы анализа «больших данных» становится бизнес, а не ИТ-специалисты. Именно бизнес может лучше оценить экономические выгоды, которые обеспечивает такая система.
- Проблемой для обработки и анализа обычно называют неструктурированные данные. Как обстоят дела с ними?
- Проблема, действительно, существует, но я думаю, что ее удастся решить с помощью объектных хранилищ. Их основная особенность в том, что они дают нам возможность работать не с данными как таковыми, а с метаданными. На входе мы получаем много файлов-источников в различных форматах, а затем гармонизируем данные, в результате чего появляется возможность быстрого анализа, которую дают нам метаданные, а при необходимости, в каком-либо конкретном случае, мы уже можем спуститься на уровень того или иного файла. Я думаю, что именно с метаданными будут работать решения по анализу и обработке «больших данных», и эта технология снимает вопрос о том, структурированы они или нет.
- В то время как компании и государственные организации присматриваются к Big Data, простые граждане все чаще говорят о боязни тотального контроля, слежки. Насколько обоснованы такие страхи?
- Нельзя сказать, что эти страхи беспочвенны. Действительно, чем больше накапливается данных о каждом человеке, тем прозрачнее становится личная жизнь, тем сложнее сохранить ее тайну. Если государственные органы научатся обрабатывать данные о человеке, поступающие из разных источников, они будут знать о каждом из нас больше, чем мы сами.
Например, в Великобритании всюду установлены устройства, считывающие номера машин. Представляете, что будет, если все поступающие с них данные будут обрабатываться и анализироваться? О передвижениях любого автомобилиста будут знать буквально все!
И ровно тот же самый вопрос возникает по отношению, скажем, к крупным Интернет-провайдерам. Если они будут обрабатывать и анализировать всю информацию, которая через них передается и частично хранится, они будут знать о нас слишком много!
Безусловно, проблемы защиты личной жизни и частной информации с ростом объемов информации выходят на первый план.
Сейчас в Евросоюзе на законодательном уровне обсуждается вопрос о том, имеет ли человек право на то, чтобы его забыли. Может ли он, например, обратиться к своему провайдеру с просьбой удалить данные о себе, хранящиеся у него? Ориентировочно, этот законопроект должен быть принят уже весной 2014 года. Конечно, в нем будут оговорки, потому что есть организации, которые по закону должны какое-то время хранить определенные данные о людях. Те же больницы, банки или полиция, но в целом должен быть какой-то законодательный механизм для того, чтобы каждый человек мог сократить количество хранящейся о нем информации.
-Не значит ли это, что важными в современном мире становятся вопросы доверия? Может ли человек верить в то, что его данные действительно будут удалены? Информационные скандалы последних лет делают этот вопрос очень актуальным.
- Конечно, чудес не бывает, и всегда будут те, кто должен был бы уничтожить данные, но по какой-то причине забыл или сознательно не сделал этого. Это так, и с этим ничего не поделаешь, но нам важно иметь некоторый законодательный механизм, который будет регулировать отношения в мире «больших данных». Это нужно для того, чтобы было, на что опираться.
Но надо понимать, что с исполнением закона и его нюансами будет связано еще немало проблем, зависящих от законодательства конкретной страны. Например, с развитием облачных сервисов в Европе ситуация неравномерная, а все потому, что британские компании, работающие на территории Великобритании, например, могут хранить данные где угодно, а французские, работающие во Франции, обязаны хранить свои данные только в своей стране. Конечно, это налагает определенные ограничения.
- Периметр систем инфобезопасности для компаний все время расширяется. Сначала из-за Интернета, теперь из-за мобильности и явлений типа BYOD. Как изменятся стратегии информационной безопасности с использованием BD?
- Именно сильное расширение границ периметра безопасности, как мне кажется, является барьером для внедрения облачных технологий. Мы видим, что основная масса проектов, которые сейчас реализуются на рынке, связана с использованием частных облаков, а не публичных. Так проще и понятнее, что именно мы хотим защитить - есть фаервол, есть какой-то зримый, осязаемый периметр, где заканчивается «свое» и начинается «чужое».
В связи с «большими данными» проблем, конечно, станет еще больше, и не только для пользователей, о чем мы уже говорили, но и для самих компаний. Как хранить много данных о своих пользователях, скажем, банку, и как передавать их другим системам?
Мне кажется, что трендом будет деперсонализация данных. То есть, передавая данные из системы в систему, мы не сможем связать тот или иной набор параметров с конкретным человеком.
Будет несколько уровней хранения информации и работы с ней. Скажем, внутри своего периметра какой-либо банк будет хранить не обезличенные данные пользователей, чтобы иметь возможность предлагать персонализированные услуги, однако, дальнейшая передача данных уже будет сопряжена с деперсонализацией. И именно в таком виде их будут хранить.
- И, наконец, как, на ваш взгляд, изменится рынок ИТ в целом с массовым использованием больших данных?
- Если использовать наши устройства, то рынок изменится в лучшую сторону (улыбается). А если серьезно, то я уверен, что в ближайшие 5-10 лет в целом будет решена задача анализа «больших данных», этот процесс станет привычным, простым и быстрым. И, возможно, решаться он будет не на уровне приложений, а еще на уровне хранения.
Анализ «больших данных» будет происходить в режиме реального времени , мы научимся делать это налету, без предварительного сохранения. Система будет работать по «замкнутому контуру»: поступление данных и их обработка будут происходить постоянно, и этот процесс будет последовательным.
И, наконец, в течение пяти лет организация объектных хранилищ (хранилищ метаданных, о которых я уже говорил) станет доминирующей технологией на рынке. Это очень удобно и, значит, будет востребовано.
Беседовала Екатерина Шлык