Rambler's Top100
Статьи ИКС № 6 2009
Владимир ШЕЛЬГОВ  16 июня 2009

Кризис кризисом, а данные хранить надо

Несмотря на продолжающийся экономический кризис аналитики довольно оптимистично оценивают перспективы развития рынка внешних дисковых систем. В условиях сокращения ИТ-бюджетов растет важность использования технологий дедупликации данных и виртуализации файлов.

Кто есть кто

 
Динамика российского рынка дисковых систем

По данным IDC, в 2008 г. объем отечественного рынка дисковых СХД вырос по сравнению с уровнем предыдущего года всего лишь на 2,3% и составил около $458 млн. В 2007 г. рост был более впечатляющим – 41,3%. На долю внешних массивов, объем продаж которых увеличился за год на 4,5%, приходится почти 65% объема рынка.

Аналитики IDC назвали пять крупнейших поставщиков дисковых СХД на российский рынок. Это компании HP, EMC, IBM, Hitachi Data Systems и Sun (перечислены в порядке убывания рыночной доли), причем первые две из них контролируют более половины рынка (58%).

Как ранее прогнозировали специалисты IDC, рынок дисковых СХД в России в ближайшие пять лет должен был расти в среднем на 21,7% ежегодно, главным образом за счет спроса на решения для сетей SAN среди корпоративных клиентов. Однако кризис внес в эти прогнозы свои коррективы. Если на протяжении первых двух кварталов прошлого года поставки уверенно росли, то в IV квартале сократились на 33% по сравнению с аналогичным периодом 2007 г.

Как отмечают в IDC, реакция потребителей СХД на кризис оказалась не столь драматичной, как в серверном сегменте, поскольку б'ольшая часть проектов по внедрению инфраструктур хранения данных планировалась и финансировалась заблаговременно, при этом их реализация занимает, как правило, несколько кварталов. Кроме того, в ряде отраслей модернизация инфраструктур хранения данных критически необходима для обеспечения непрерывности ведения бизнеса.
По оценкам IDC, под влиянием глобального экономического кризиса в 2009 г. мировой объем продаж внешних дисковых массивов уменьшится на 3,1% по сравнению с уровнем прошлого года, а емкость таких систем, установленных во всем мире, возрастет на 44% (прежде она росла на 50–60% в год). Аналитики IDC прогнозируют, что в ближайшие пять лет мировые продажи внешних дисковых массивов будут увеличиваться в среднем на 1,9% в год, причем их стоимость в расчете на гигабайт емкости будет снижаться на 30% ежегодно. Драйвером роста спроса на дисковую память является непрерывное увеличение объемов цифровых данных, сохраняемых на предприятиях. В то же время этот рост будет замедляться по мере распространения технологий, обеспечивающих более эффективное использование систем хранения данных (СХД) и уменьшение объема сохраняемой информации.

Согласно отчету IDC за IV квартал 2008 г., крупнейшие мировые производители внешних дисковых СХД – компании EMC (доля рынка 23,3%), IBM (15,7%), HP (13%), Dell (9,3%), Hitachi (7,8%), NetApp (7%) и Sun Microsystems (5,2%). Все они активно работают и в нашей стране, предлагая широкий ассортимент дисковых СХД разных типов и классов, а также сопутствующее ПО для управления хранением данных. Особое место среди лидеров рынка занимает компания NetApp, специализирующаяся на выпуске серверов NAS (Network-Attached Storage – NAS). Такого рода СХД есть и в продуктовых портфелях EMC, IBM, HP и многих других производителей дисковых массивов. EMC, Hitachi и ряд других компаний выпускают системы CAS (Content-Addressable Storage), предназначенные для архивного хранения не подлежащих редактированию данных (фиксированного контента). В нашей стране объемы продаж таких систем и виртуальных ленточных библиотек (Virtual Tape Libraries – VTL) пока невелики, но спрос на них растет быстрее, чем на дисковые СХД других типов. Напомним, что VTL представляет собой дисковый массив, имитирующий (для сервера резервного копирования) работу обычной библиотеки магнитных лент.

Это что-то новенькое!

Виртуализирующий дисковый массив EVA6400  компании HPВ текущем году многие ведущие производители внешних дисковых СХД выпустили новые продукты.

EMC анонсировала архитектуру дисковых массивов высшего класса Virtual Matrix Architecture, предназначенную для организации виртуальных ИТ-сред центров обработки данных (ЦОД), и первую дисковую систему на основе этой архитектуры – EMC Symmetrix V-Max, которая уже поступила в продажу. В названной системе применяются диски EFD (корпоративные флэш-накопители), Fibre Channel (FС) и SATA. Новинка, пополнившая семейство систем хранения высшего класса EMC Symmetrix DMX-4, превосходит их по производительности и эффективной емкости втрое, а по числу интерфейсов вдвое и при этом потребляет значительно меньше энергии в расчете на терабайт емкости.

Корпорация IBM представила интегрированное решение System Storage TS7650 ProtecTIER Deduplication Appliance, основные компоненты которого – сервер IBM System x, дисковая подсистема и ПО дедупликации данных ProtecTIER. Это решение, предназначенное для эффективного хранения резервных копий данных, появилось в продуктовом портфеле корпорации в результате покупки ею в прошлом году фирмы Diligent Technologies.

На смену виртуализирующим дисковым массивам EVA6100 и EVA8100 компания HP выпустила новые модели – EVA6400 и EVA8400, ориентированные на средние и крупные предприятия соответственно. По сравнению со своими предшественниками они примерно на 20% быстрее выполняют операции чтения и записи, имеют кэш-память увеличенного объема, поддерживают больше дисков, реализуют технологию Vraid 6 и работают с твердотельными накопителями (Solid-State Drives – SSD). Модели EVA6400 и EVA8400 поддер-живают до 216 и 324 дисков соответственно и позволяют сконфигурировать до 2048 логических устройств объемом до 32 Тбайт каждое. Использование технологий виртуализации в массивах серии EVA обеспечивает объединение их накопителей в единый пул дискового пространства, автоматическую настройку производительности этих массивов и упрощает управление ими. Благодаря этому, как показали исследования, проведенные компанией The Edison Group, предприятия могут сократить до 50% расходов на администрирование дисковой памяти.

Дисковый массив EqualLogic серии PS6000  компании DellКроме того, компания HP анонсировала предназначенные для небольших предприятий массивы MSA2300fc, которые в отличие от ранее выпущенных устройств MSA2000fc оснащены более быстрыми микропроцессорами, снабжены улучшенными функциями защиты данных, поддерживают большее число дисков (включая 2,5-дюймовые диски серверов HP ProLiant) и совместимы не только с серверами стандартной архитектуры (x86), но и с серверами Integrity.

Dell выпустила устройства EqualLogic серии PS6000. По сравнению с продуктами серии PS5000 новинки быстрее выполняют последовательные операции – записи на 91%, а чтения на 29%. В состав новой серии вошла модель PS6000S, поддерживающая SSD-накопители. Продукты EqualLogic представляют собой дисковые массивы iSCSI, объединяемые в группы. Общая производительность группы (в которой ПО виртуализации выравнивает нагрузку между массивами) увеличивается по мере добавления к ней новых массивов.

Sun выпустила дисковые массивы Sun Storage 6580 и 6780, предназначенные для средних и крупных предприятий соответственно. Первая модель имеет до 256 дисков (SATA и FC), а вторая, выполняющая операции ввода-вывода в два раза быстрее, – до 448. Обе поддерживают конфигурацию RAID уровня 6.

А что же наши?

На российском рынке внешних дисковых СХД представлена и продукция отечественных производителей, суммарная доля рынка которых, по оценкам компании Depo Computers, не превышает 10%. В России выпускаются дисковые СХД начального и среднего уровней – относительно недорогие устройства NAS и массивы, ориентированные на прямое подключение к серверам (Direct-Attached Storage – DAS) или на использование в небольших сетях хранения данных (Storage-Area Networks – SAN). В сегменте СХД высшего класса безраздельно господствуют ведущие мировые производители.

В Depo констатируют, что на рынке СХД (как и на рынке серверов) отечественные компании имеют ряд конкурентных преимуществ: более короткие сроки поставок, меньшая стоимость изделий, возможность адаптации их под конкретные требования заказчиков и предоставление последним комплексных ИТ-решений. Как отмечают в компании EMC, отечественные СХД покупают в основном государственные структуры и предприятия малого бизнеса, для которых важнейшим критерием при выборе СХД является цена.

Камо грядеши, рынок СХД?

Российский рынок внешних дисковых СХД развивается по тому же пути, что и соответствующие рынки западных стран. Все больше отечественных заказчиков воспринимают СХД как самостоятельные элементы ИТ-инфраструктуры и выбирают внешние дисковые массивы в качестве основы для организации своих сред хранения данных. Системы DAS  постепенно вытесняются более гибкими сетевыми  решениями, обеспечивающими одновременное использование одной СХД несколькими серверами и выполняющими разнообразные функции управления хранением данных.

В сетях SAN по-прежнему преобладает технология FC, но все больше решений реализуется на базе протокола iSCSI. По данным IDC, в 2008 г. объем продаж дисковых массивов iSCSI в нашей стране вырос более чем на 710% и составил $10,8 млн.

Использование протокола iSCSI – относительно недорогой способ объединения ЛВС и SAN в единую сеть на базе имеющейся на предприятии инфраструктуры Ethernet. Впрочем, существует и другой протокол – FCoE (Fiber Channel over Ethernet), призванный обеспечить конвергенцию вышеупомянутых сетей. Его активно продвигает компания Cisco в качестве основы для реализации объединенных сетей ЦОДов. В этом протоколе предусмотрена инкапсуляция кадров FC в кадры Ethernet и использование улучшенной технологии Ethernet – Converged Enhanced Ethernet (CEE) или Data Center Ethernet (DCE), исключающей потерю пакетов, что очень важно для нормального функционирования СХД. Компания Cisco выпускает DCE-совместимые FCoE-коммутаторы Nexus. По словам представителей компании, данное оборудование довольно широко используется в ее собственной корпоративной сети.

Для организации сети FCoE, помимо соответствующих коммутаторов, нужно задействовать (в серверах) конвергентные сетевые адаптеры, заменяющие собой отдельные сетевые интерфейсные платы Ethernet и хост-адаптеры FC. В Cisco уверены, что переход на объединенную сеть на базе технологии FCoE позволит значительно снизить совокупную стоимость владения ИТ-инфраструктурой ЦОДа.

Недавно компания Brocade, ведущий производитель коммутаторов FC, выпустила на рынок FCoE-коммутатор Brocade 8000 (с 24 портами 10-Gigabit Ethernet CEE и восемью 8-Гбит/с портами FC) и конвергентные сетевые адаптеры (одно- и двухпортовую модели). В стане сторонников FCoE – крупнейшие игроки ИТ-рынка, включая компании EMC, HP, IBM и др.

Пожалуй, правы эксперты, которые считают технологии iSCSI и FCoE не конкурирующими, а взаимодополняющими и нацеленными на удовлетворение разных потребностей заказчиков. Протокол iSCSI привлекателен для организации небольших сетей SAN, а технология FCoE со временем может получить широкое распространение в крупных ЦОДах. Важное достоинство FCoE-решений – хорошая совместимость с сетями и устройствами FC. Впрочем, в Dell полагают, что нынешний экономический кризис задержит внедрение технологии FCoE на предприятиях, ведь для этого им понадобится дорогостоящее сетевое оборудование.

Заказчикам СХД стоит отслеживать развитие средств SAS (Serial-Attached SCSI). Технология SAS перестала быть простой заменой технологии SCSI для подключения к серверу жестких дисков, поскольку с появлением в продаже SAS-коммутаторов появилась возможность строить полноценные сети SAN (на базе SAS), хотя пока и с небольшим числом портов. В HP считают, что SAN на основе SAS является хорошей альтернативой SAN на основе FC при организации небольшой инфраструктуры хранения данных. Распространение сетевых SAS-решений сужает область применения протокола iSCSI.

Важная технологическая инновация, влияющая на развитие рынка внешних дисковых СХД, – это появление в них SSD-накопителей корпоративного класса. Такие устройства потребляют меньше электроэнергии, чем жесткие диски, и работают значительно быстрее последних при произвольном считывании коротких блоков данных, но при потоковом выводе их производительность примерно одинакова. Серьезные недостатки SSD-накопителей по сравнению с обычными винчестерами – меньшая емкость, гораздо более высокая цена в расчете на единицу емкости и ограниченное число циклов перезаписи информации (после чего твердотельная память выходит из строя). Производители успешно борются с указанными недостатками, и будущее СХД, безусловно, за SSD-устройствами.

По мере удешевления дисковых систем в расчете на единицу емкости растет популярность решений для резервного копирования данных по схеме «с диска на диск». В кризисных условиях в этих решениях все большее значение приобретает использование технологий дедупликации данных, исключающих хранение идентичных друг другу копий данных и тем самым обеспечивающих значительную экономию дисковой памяти. Дисковые системы резервного копирования с функциями дедупликации данных (в том числе VTL-продукты) появились в продаже довольно давно. Сегодня эти функции реализуются и в первичных информационных хранилищах типа NAS.

Как избежать повторов

Существует несколько технологий дедупликации данных. Одни из них встраиваются в файловую или операционную систему серверов NAS, а другие реализуются в дополнительных устройствах, работающих с имеющимися на предприятиях файловыми серверами. Дедупликация осуществляется либо в процессе записи данных на диски (в режиме реального времени), либо по окончании этого процесса (в виде постобработки записанной информации). В первом случае расход дисковой памяти минимален, но требуется много вычислительной мощности, что может привести к замедлению работы устройства NAS. При постобработке нужно больше дисковой памяти (для кэширования записываемых данных), зато ее (постобработку) можно проводить в часы наименьшей загрузки информационного хранилища, а значит, маловероятно, что эта процедура повлияет на его производительность.

Средства дедупликации делят файлы на фрагменты, находят повторяющиеся фрагменты и удаляют их. В одних алгоритмах дедупликации используются фрагменты фиксированной длины, в других – переменной, что повышает эффективность дедупликации, но усложняет сам алгоритм.

В NAS-устройствах фирмы NetApp файловая система WAFL хранит файлы в виде совокупностей блоков фиксированной длины и рассчитывает контрольную сумму для каждого блока. Поскольку одинаковость контрольных сумм не дает 100%-ной гарантии идентичности блоков, два блока с одинаковыми контрольными суммами проверяются на идентичность путем побайтного сравнения и, если они полностью совпадают, один из них удаляется, а указатель на него переставляется на оставшийся блок.

С блоками переменной длины работает NAS-продукт Cypress компании GreenBytes, а фирма Riverbed Technology разработала устройство Atlas, которое в реальном масштабе времени дедуплицирует данные, записываемые на любой файловый сервер с файловой системой CIFS или NFS. Для повышения эффективности дедупликации Atlas использует небольшие блоки данных переменной длины.

Самая простая технология дедупликации – так называемое одноэкземплярное хранение файлов (Single-Instance Storage – SIS). Она находит многочисленные копии одного и того же файла, оставляет единственный экземпляр, а остальные заменяет ссылками на него, создающими впечатление, что этот файл хранится в разных местах и под разными именами.

Технология SIS реализована в NAS-устройстве Celerra компании EMC, которое к тому же сжимает данные. Функцию SIS выполняет и пакет Windows Storage Server компании Microsoft.

Даешь виртуализацию файлов!

Технологии виртуализации файлов позволяют администраторам СХД логически объединять ресурсы дисковой памяти и использовать их более эффективно. Средства виртуализации анализируют среду хранения данных и собирают статистическую информацию о выполнении операций ввода-вывода и свободном дисковом пространстве, которое они автоматически распределяют согласно определенным администратором правилам системной политики.

Средство виртуализации действует между клиентскими устройствами и приложениями с одной стороны и системами хранения – с другой. При этом клиентские устройства и приложения конфигурируют для подключения к уровню виртуализации, который представляется им в виде одной гигантской СХД с глобальным пространством имен. После этого средство виртуализации управляет реальными соединениями с накопителями.

Помимо обеспечения более эффективного использования ресурсов хранения данных, уровень виртуализации упрощает выполнение операций перемещения (миграции) и копирования данных. Некоторые средства виртуализации файлов позволяют администраторам перемещать файлы даже в процессе редактирования их пользователями. С помощью средств виртуализации администраторы могут лучше управлять размещением данных, перенося устаревшую информацию на системы хранения второго уровня (в иерархии памяти).

Средства виртуализации файлов обычно работают на пути их передачи (in-band) или в стороне от него (out-of-band). К решениям типа in-band относятся продукты ARX компании F5 и File Management Engine фирмы Brocade. Они функционируют как серверы-посредники, обрабатывая каждый пакет, который передается между клиентскими устройствами и системами хранения.

Средство out-of-band-виртуализации представляет собой устройство, подключаемое к коммутатору. Оно просматривает трафик систем хранения и посредством пространства имен направляет данные на должную систему, но не перехватывает каждый передаваемый пакет. К out-of-band-продуктам относятся StorageX фирмы Brocade и Rainfinity компании EMC. Последняя позиционирует устройство Rainfinity в качестве гибридного решения для виртуализации файлов. Дело в том, что обычно его устанавливают вне пути передачи данных, но в рамках определенной политики оно может действовать и как in-band-устройство.

У каждого из двух подходов к реализации виртуализации файлов (in-band и out-of-band) свои достоинства и недостатки. Основное достоинство in-band-виртуализации в том, что она дает возможность администраторам СХД перемещать файлы даже в момент их использования. Благодаря этому отпадает необходимость в плановых отключениях устройств хранения, во время которых пользователи и приложения не имеют доступа к своим данным. Завершив перемещение файлов, система in-band-виртуализации обновляет пространство имен, вводя в него информацию о новом физическом местонахождении файлов. Средства out-of-band- виртуализации неспособны перемещать используемые (открытые) файлы.

Кроме того, системы in-band-виртуализации обеспечивают более гибкое управление данными. Администраторы устройств хранения могут определять правила системной политики, в которых предусматривается выполнение тех или иных действий в зависимости от метаданных файлов, таких как тип файла (например, mp3 или Excel), дата его создания или время последнего обращения к нему. Средства out-of-band-виртуализации файлов перемещают только папки целиком, но не отдельные файлы.

Конечно же, in-band-продукты не лишены недостатков. Самый серьезный из них – возможность  возникновения большой временн'ой задержки при пересылке данных. Поскольку устройство in-band-виртуализации находится на пути их передачи и должно обрабатывать все проходящие пакеты, оно может стать узким местом сети. Эту потенциальную проблему обязательно нужно принимать во внимание, планируя внедрение такого продукта в сеть с большими объемами трафика. Следует скрупулезно оценивать производительность выбираемых in-band-устройств, чтобы удостовериться, что они справятся с рабочей нагрузкой, особенно если эти устройства реализованы с использованием широко распространенных компонентов ПК, а не на основе специализированной аппаратной платформы.

Еще одна проблема заключается в том, что при отказе in-band-продукта клиентские устройства теряют доступ к СХД. И если этот продукт создает свое собственное пространство имен, то после возвращения его «в строй» администраторам придется воссоздавать это пространство имен.

Очевидным решением вышеуказанных проблем является развертывание кластеров in-band-продуктов. Это поможет повысить пропускную способность системы виртуализации и надежность ее работы. Однако такое решение увеличивает и стоимость системы виртуализации.

Поломка out-of-band-устройства не приводит к потере связи с системами хранения данных (поскольку оно работает вне пути их передачи). И еще. Для образования пространства имен out-of-band-устройства обычно используют распределенную файловую систему Microsoft DFS. В случае отказа в работе этого устройства среда DFS будет иметь самую последнюю конфигурацию пространства имен, в результате клиентские устройства и приложения смогут по-прежнему находить свои данные. 
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!
Поделиться: