Rambler's Top100
Все новости Новости отрасли
Екатерина ШЛЫК 12 декабря 2012

Big Data для больших данных

К 2020 году объемы производимых цифровых данных превысят отметку в 40 зеттабайт - это примерно 5200 гигабайт на каждого жителя планеты, включая младенцев и стариков. Как мир будет справляться с такими объемами данных, какие технологии получат развитие? Оценка существующей ситуации и прогноз до 2020 года предлагают IDC и EMC в отчете Digital Universe .

Из чего формируется «цифровая Вселенная»? Из роликов на YouTube, из фото в соцсетях, из электронных писем, из «отчетов» банкоматов, из баз данных служб безопасности… В общем, из всех тех данных, которые в современном мире окружают нас повсюду и всегда. Все, от короткого сообщения до данных, передаваемых Большим андронным коллайдером – все является составной частью этой Вселенной. И объемы генерируемых данных растут на сотни процентов в год.

Чтобы достичь таких показателей, говорят аналитики, производство цифровых данных будет до 2020 года расти примерно на 200% каждые два года. Причем, по мнению аналитиков IDC, только 33% данных к 2020 году будут структурированными (и, соответственно, будут поддаваться анализу). Остальные данные будут неструктурированными, и отрасли еще только предстоит найти эффективные инструменты для анализа и оборудование для хранения.

Аналитики подсчитали, что 68% данных в 2012 году было сгенерировано пользователями за счет просмотра цифрового ТВ, общения в социальных медиа, публикации фотографий и роликов и т.д. Но при этом 80% данных приходят в «цифровую Вселенную» от крупных компаний, даже в том случае, если они сгенерированы конечными пользователями. Косвенно это связано и с тем, что год от года растут объемы данных, требующих дополнительной защиты – к 2020 году таких данных будет свыше 40%.

При этом, отмечают в IDC, и сейчас, и, видимо, в обозримом будущем, необходимую защиту получают далеко не все данные, которые в этой защите нуждаются – потребность в развитии решений по информационной безопасности растет быстрее, чем эти решения создаются и работают.

Сейчас в «географической структуре» Big data лидируют США и Европа, но уже к 2020 году пальма первенства перейдет к развивающимся рынкам.

Естественно, одновременно с ростом данных будут расти и инвестиции в инфраструктуру – к 2020 году они вырастут примерно на 40%, прогнозируют аналитики, а инвестиции в СХД, безопасность, облачные технологии и big data будут расти еще быстрее.

В отчете указано, что трендом 2012 года стала тема Big data («больших данных»). ИТ-компании и аналитики говорят, что это не просто определение, это – новая технология. В отчете Digital Universe компания IDC определяет Big Data как новое поколение технологии и архитектуры, разработанное для экономически эффективной и быстрой работы  (включая анализ информации) с большими объемами различных данных. Три ключевых составляющих «больших данных» - это собственно данные, их анализ и результат анализа.

Не все данные нужны для Big Data, но есть категории данных, которые необходимы для анализа. Это данные видеонаблюдения, данные медицинских приборов, данные социальных медиа и сектора развлечений, пользовательские фотографии и ролики.

По мнению IDC, на текущий год «полезны» для Big Data не более 25% всей имеющейся цифровой информации. Но, к сожалению, обработано из нее не более 3%, а проанализировано – и того меньше. Таким образом, очевидно, в каком направлении нужно развиваться отрасли, чтобы работать с новой технологией.

Что касается «облаков», то по прогнозам IDC, к 2020 году около 40% данных будут так или иначе «проходить через руки» облачных провайдеров. То есть храниться и/или обрабатываться данные будут где-то в пути между создателем и получателем данных. При этом храниться в «облаке» будет сравнительно небольшая часть данных – порядка 13%.

Сейчас глобально на облачные технологии тратится не более 5% всего ИТ-бюджета, а компании, организующие частное облако, часто ограничиваются виртуальным сервером, не сопровождая эти услуги ни возможностью самостоятельной работы, ни необходимым уровнем безопасности, ни гарантиями бесперебойной работы.

Сейчас, отмечают аналитики, уровень проникновения «облаков» невысок, но к 2020 году их использование может стать обычным делом. Более того, облаков будет так много и они будут так тесно взаимосвязаны, что речь может идти уже не просто об «облаке». А о целом «эфире». Но, предупреждают в IDC, управление такой структурой и хранение и защита данных в ней будут непростой задачей.

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Оставить свой комментарий:

Для комментирования необходимо авторизоваться!

Комментарии по материалу

Данный материал еще не комментировался.