Рубрикатор |
Статьи | ИКС № 07-08 2010 |
Игорь КАСЬЯНОВ  | 27 июля 2010 |
Эффективность системы хранения данных: требуется анализ
Объемы данных, которые современным компаниям приходится обрабатывать и хранить, растут со скоростью 50–70% в год. Современные СХД активно увеличивают свою емкость и функциональные возможности, стоимость хранения 1 Мбайт информации с каждым годом снижается, но затраты на хранение информации все равно повышаются. В чем причина?
На рынок постоянно выводятся новые аппаратные и программные средства записи и сжатия данных, резервного копирования и т.д. Однако корпоративные данные обычно очень разнородны, требуют различных методов обработки, условий хранения, защиты, скорости доступа и т.д. Поэтому типовых схем построения корпоративных систем хранения данных (СХД) по большому счету не существует, и создание любой СХД – это индивидуальный проект, учитывающий самые разные технические и экономические требования заказчика, объективные и субъективные факторы, присутствующие в организации.
Многие согласятся, что основным критерием эффективности СХД должна быть минимизация стоимости хранения данных, определяемая TCO (total cost of ownership). Но есть и некоторые нюансы: как показывает практика, современные российские заказчики крайне неохотно соглашаются потратить значительные средства (скажем, миллион и более долларов) даже на самую современную систему хранения, обещающую грандиозную экономию в будущем. Чаще всего они предпочитают уменьшить совокупную стоимость владения СХД хотя бы на 30% в ближайшей перспективе при минимальных капитальных затратах сегодня.
Далеко не всегда ключевым фактором при выборе аппаратных средств, ПО и методов построения корпоративных систем хранения является емкость СХД, так как зачастую на первый план выходят высокая надежность хранения, сверхскоростной доступ к данным, поддержка одновременной работы большого количества пользователей и т.п. Простое же увеличение объема СХД путем добавления быстродействующих и емких дисков может привести лишь к неоправданному увеличению затрат на хранение данных.
Сколько компаний, столько и СХД
Изучение структуры спроса на СХД показывает, что их пользователей следует классифицировать не столько по размерам организаций и, следовательно, по объему хранимых данных, сколько по специфике их деятельности. Так, небольшая организация с двумя десятками пользователей может обладать объемным хранилищем фото- или видеоматериалов, не требующих скоростного доступа в режиме реального времени. А на другом предприятии тысячам пользователей необходимо обеспечить одновременный высокоскоростной доступ к небольшой по объему базе данных, состоящей из множества коротких записей.
Еще одно требование – унификация хранения данных. Например, банк желает хранить в своем централизованном и унифицированном хранилище данных финансовые данные операционного дня, видеопотоки с камер видеонаблюдения и пр. То есть большой объем видеоданных, к которым обращаются крайне редко, должен сочетаться с относительно небольшим объемом данных, пользующихся постоянным спросом и требующих высокоскоростного доступа. Таким образом, в одной СХД нужно реализовать очень разные требования.
Очевидно, что как при создании новой СХД, так и при модернизации или наращивании старой необходимы три вещи: анализ, анализ и еще раз анализ тех самых объективных и субъективных факторов и требований заказчика. Нужно детально изучить состояние системы хранения, характер ее использования, требования к новой СХД, экономические последствия их выполнения и т.д. и на основе результатов этого анализа правильно организовать хранение данных. Также нельзя упускать из виду, что основная цель всех преобразований состоит в оптимизации хранения данных.
Кроме того, со временем практически у всех компаний требования к системам хранения меняются. Кроме банального увеличения объема хранения, растет или уменьшается количество пользователей, появляется необходимость в хранении данных других типов, в ускорении доступа к данным и т.п. В ответ на это ведущие производители оборудования уже давно предлагают различные решения, например возможность замены контроллера и ПО для СХД или проведение модернизации операционной системы и микрокода в СХД высшего корпоративного класса, что позволяет подключать к старой системе новые модули расширения с поддержкой других протоколов и смешивать диски разного типа (SAS, SATA, Fibre Channel). Таким способом можно развивать систему хранения в течение многих лет, конечно, при условии, что пользователь четко знает, каким должно быть направление этого развития. Но для подобной оптимизации СХД опять же необходимо тщательно проанализировать ситуацию и поставленные задачи, чтобы определиться, какой в результате должна стать СХД. Поэтому создание или модернизацию СХД разумно осуществлять с привлечением квалифицированных специалистов.
Вездесущая виртуализация
Технологии виртуализации систем хранения данных многогранны. Их применение не всегда однозначно и не всегда может быть правильно определено. Однако существуют рекомендуемые области использования виртуализации СХД.
Например, технология виртуализации хорошо работает в деле объединения двух несовместимых СХД. Сегодня практически все производители СХД выпускают так называемые контроллеры виртуализации. В виртуализованной СХД пользователь «видит» принадлежащие ему однотипные тома и диски с указанием их функциональных характеристик (скорость доступа, объем и т.д.) без привязки к их физическому расположению на реальных дисках и томах СХД. В таких системах реализована поддержка даже очень старых устройств хранения с SCSI-интерфейсом. Эти системы при необходимости позволяют прозрачно для пользователя переносить данные из архивов на дешевых носителях на быстродействующие накопители для оперативной работы с ними, а потом отправлять их обратно без прерывания в обслуживании.
Виртуализация позволяет провести консолидацию всего многообразия корпоративных данных без деления их по принадлежности к тому или иному производственному подразделению. Благодаря виртуализации все данные имеют понятное централизованное представление, позволяющее легко управлять ими, несмотря на то что физически они могут находиться в разных отделах, зданиях, городах и даже странах. При этом централизованное хранение данных далеко не всегда оправданно: данные должны находиться как можно ближе к их потребителю, чтобы не загружать сеть передачей больших объемов информации, что связано с дополнительными расходами. Когда идет речь о консолидации данных, ТСО старых СХД с контроллерами виртуализации часто оказывается ниже, чем у новых. Тем более что новые системы хранения всегда можно добавить к существующим без ущерба для прозрачности корпоративных данных.
Иерархическое управление носителями
Еще одним важным способом снижения совокупной стоимости владения СХД, капитальных и операционных затрат является использование давно известной технологии многоуровневого хранения. В подавляющем большинстве ситуаций одноуровневая СХД, т.е. использующая один тип носителей (только диски, только ленты и т.п.), как бы ее ни оптимизировали, будет обходиться пользователю дороже многоуровневой.
Оптимизация многоуровневой системы представляет собой гораздо более благодарное занятие, тем более если речь идет об СХД крупной компании или большого инфраструктурного ЦОДа. Данные, постоянно нужные для работы, могут храниться даже на очень дорогих SSD-дисках, а прочие данные, потребность в которых возникает раз в два-три месяца, должны отправляться в ленточный архив; для промежуточной ситуации подойдут традиционные жесткие диски (в последнее время, как правило, дешевой архитектуры SATA), и это будет вполне оправданно с экономической точки зрения. Во времена старых больших компьютеров такой принцип называли иерархическим управлением носителями (Hierarchical Storage Management).
Как же спроектировать корпоративную систему хранения данных?
Едва ли не самой важной стадией создания корпоративной системы хранения является ее проектирование и разработка. При проектировании корпоративных систем хранения данных требуется тщательный анализ имеющейся системы хранения и параметров будущей СХД:
• какие базы данных используются;
• какие данные в них хранятся;
• какие архивы нужны;
• для каких данных нужны резервные копии и сколько их должно быть;
• как часто надо обновлять данные;
• сколько у них пользователей;
• сколько пользователей будут работать с данными одновременно;
• как часто пользователи обращаются к тем или иным данным;
• какая скорость доступа им нужна и т.д.
Только проанализировав всю эту информацию, можно определить организационную структуру хранилища, необходимую дисковую емкость (в том числе SSD-дисков), объем ленточной библиотеки, размер промежуточного дискового кэша (если есть ограничения на время перекачки данных на ленту) и т.п. Некоторые производители оборудования предлагают специальные средства для помощи в проектировании СХД, которые автоматически обрабатывают данные, собранные посредством стандартных опросных листов, и на выходе дают рекомендации по организации хранения, а также экономические показатели эффекта от внедрения корпоративного хранилища. Однако работа с ними требует определенного опыта и подготовки.
Проблемы, стоящие на пути к эффективной СХД, могут оказаться очень сложными. Скажем, имеющиеся данные нужно перенести на новые носители или перераспределить между старыми и новыми носителями. Хорошо, если эти данные уже не меняются и не используются или используются очень редко. А если это данные, к которым пользователи обращаются 24 часа в сутки, 7 дней в неделю? А если старая и новая СХД выпущены разными производителями и в них используются разные внутренние протоколы обработки данных? Например, функции дупликации и репликации лент не работают между системами разных производителей и не всегда поддерживаются даже между системами разных поколений одного и того же производителя...
Решение всех этих проблем в каждом конкретном случае существует, но для его поиска требуется анализ, анализ и еще раз анализ, и лучше доверить его профессионалам. икс