Rambler's Top100
Статьи ИКС № 7-8 2008
Игорь Петрович ЛИТВИНОВ  28 июля 2008

ЦОД, который не боится катастроф

Компании все сильнее зависят от своих информационных систем. Для создания катастрофоустойчивых дата-центров крупнейшие корпорации могут позволить себе самые сложные решения и дорогостоящие технологии. Существуют ли катастрофоустойчивые решения для среднего бизнеса и полностью ли они удовлетворяют требованиям российских заказчиков?

Игорь ЛитвиновДвигатели прогресса

 

Растущая стоимость корпоративной информации диктует свои требования к конфигурации ЦОДов, заставляя предприятия создавать полноценные решения. Чем дороже данные, тем больше усилий требует их защита.

 

Второй бизнес-движитель, определяющий облик современного ЦОДа, – необходимость постоянного повышения эффективности использования ИТ-ресурсов. Стоимость эксплуатации ИТ-систем увеличивается год от года и намного опережает рост бюджетов ИТподразделений. Руководители ИТ-служб непрерывно предпринимают усилия по сокращению издержек – иначе средств на развитие просто не останется.

 

Быстро изменяющаяся бизнес-среда – третья тенденция, влияющая на ИТ-инфраструктуру. ИТ-директора озабочены оперативным и качественным обслуживанием запросов бизнеспользователей. Чем большей гибкостью обладает ИТ-инфраструктура, тем быстрее и проще ее можно перестраивать под изменяющиеся требования бизнеса.

 

На эти общие движители развития ИТ-инфраструктуры налагаются специфические требования для отдельных отраслей. Характерный пример – розничный банковский бизнес. Предприятия хотят быть ближе к потребителям и поэтому вместо нескольких крупных филиалов открывают множество киосков или точек продаж и обслуживания клиентов. Однако в таких точках нет собственных данных. Это всего лишь киоски, а все данные должны надежно храниться и обрабатываться в ЦОДах, расположенных на центральных технологических площадках. Понятно, что от надежности функционирования такой площадки зависят все бизнеспроцессы и в конечном счете сам бизнес организации.

 

Облик современного ЦОДа

 

Итак, требования бизнеса в полной мере определяют направления развития современных ЦОДов и всей ИТ-инфраструктуры компании. ЦОД должен:

 

1 быть централизованным (консолидированным). Защитить информацию, хранящуюся на одной технологической площадке, гораздо проще, чем обеспечить контроль за данными, распределенными по всей компании.

 

2  быть гибким и адаптивным. Инфраструктура должна легко и быстро подстраиваться под требования бизнеса.

 

3  соответствовать требованиям экономической эффективности. Его ресурсы должны утилизироваться, т.е. быть по возможности равномерно и полно загружены.

 

4  соответствовать требованиям производительности, масштабируемости и надежности.

 

5 обеспечивать непрерывность бизнеса. С определенного момента компании становятся настолько зависимыми от своих ИС, что простой ИТ-сервисов приводит в большинстве случаев к недопустимому ущербу.

 

Выполнение первых четырех требований к ЦОДам способны обеспечить такие инструменты, как консолидация, виртуализация и стандартизация вычислительных ресурсов и систем хранения данных.

 

Консолидация (объединение ИТ-ресурсов на базе одной технологической площадки или даже одного крупного решения) обеспечивается и на уровне хранения данных, и на уровне вычислительных ресурсов. Примечательно, что если консолидация хранения данных производится заказчиками достаточно давно (масштабные хранилища данных уже созданы в крупных компаниях, операторах связи и банках), то консолидацией вычислительных ресурсов ИТ-руководители предприятий активно занимаются сейчас.

 

Виртуализация – это средство балансировки нагрузки и, следовательно, повышения утилизации ресурсов. Она подразумевает запуск нескольких виртуальных программных сред или создание на одном реальном физическом устройстве нескольких виртуальных. Если для решения одной бизнес-задачи выделено достаточно ресурсов, а для другой их не хватает, то виртуализация помогает эти ресурсы гибко перераспределять. До последнего времени она активно применялась для повышения гибкости и эффективности использования систем хранения данных, а сейчас – вычислительных систем.

 

Стандартизация ИТ-ресурсов означает использование при построении ЦОДа решений, основанных на индустриальных стандартах. Это поможет обеспечить необходимую гибкость дата-центра. В случае выхода из строя какоголибо устройства оно без труда может быть заменено на аналогичное.

 

Несколько сложнее обстоит дело с катастрофоустойчивостью – возможностью оперативного восстановления критически важных ИТ-сервисов и корпоративных данных в случае масштабных аварий на технологических площадках ЦОДов.

 

Непрерывность бизнеса, или Сохранность яиц в одной корзине

 

Консолидация ИС, ИТ-сервисов и корпоративных данных в крупных дата-центрах радикально повышает требования к обеспечению непрерывности бизнеса. С одной стороны, консолидация повышает качество предоставления ИТсервисов, простоту и эффективность эксплуатации, утилизацию ресурсов, а с другой – компания становится заложником надежности одного ЦОДа. Фактически все яйца кладутся в одну корзину, и если с дата-центром чтонибудь случится (пожар, землетрясение и т.п.), то все данные могут потеряться. Как это предотвратить?

 

Обеспечивать сохранность данных можно посредством их резервного хранения на удаленной площадке. В случае аварии данные уцелеют, но процессы восстановления ИТсервисов займут много времени. Компания практически будет простаивать, пока не будет создан новый ЦОД. На это уйдут недели, и далеко не каждое предприятие может это себе позволить.

 

Для обеспечения непрерывности бизнеса необходимо построение полноценной резервной площадки с воспроизведением критически важных сервисов и постоянная репликация данных между основной и удаленной площадками. Именно постоянная репликация и составляет суть катастрофоустойчивого решения – в случае аварии она позволит быстро восстановить критически важные для бизнеса сервисы.

 

Построение резервной площадки – задача нетривиальная. Для ее решения необходимо проработать множество ответов на вопросы «а что будет, если...?». Ведь может возникнуть неисправность основной системы хранения данных, а серверы продолжат работать, может выйти из строя не основной, а резервный ЦОД или нарушиться канал связи между технологическими площадками и т.д. Каждый случай предполагает множество сценариев дальнейшего развития событий, и для сохранения непрерывности бизнеса нужно заранее предусмотреть все варианты.

 

Какие катастрофоустойчивые решения для крупного и среднего бизнеса чаще всего предлагаются? Как правило, строятся две системы хранения и организуется репликация данных между ними. Выбираются критичные для бизнеса информационные ресурсы, которые должны функционировать при любом развитии событий. Вычислительные ресурсы, необходимые для оказания выбранных ИТсервисов, воспроизводятся на удаленной площадке. А далее следует самое важное – настройка логики поведения в той или иной ситуации. Обычно это делается с помощью кластерного ПО. Это может быть ПО производителей серверных решений (например, Sun Cluster, HP Service Guard, IBM HACMP) или продукты независимых вендоров, например Veritas Cluster Server компании Symanteс. Кроме того, можно использовать сервисы высокой доступности, заложенные в решении для виртуализации компании VMware. Настройка кластерного взаимодействия между основной и резервной площадкой – достаточно сложный процесс, предполагающий подробное рассмотрение различных вариантов аварий и написание сценариев развития событий для каждого из них. Однако при этом остаются случаи, для которых с точки зрения формальной логики нет рационального решения (например, обрыв канала связи между двумя технологическими площадками) и полная автоматизированность восстановления сервисов достигнута не будет.

 

Динамический виртуализованный катастрофоустойчивый ЦОД

 

При построении катастрофоустойчивого ЦОДа, доступного среднему бизнесу, мы рекомендуем обеспечивать виртуализацию на всех уровнях – как на уровне систем хранения данных, так и на уровне сети хранения и вычислительных ресурсов. Решение, удовлетворяющее этим требованиям и основанное на продуктах NetApp, Dell и VMware, было внедрено у наших заказчиков и доказало свои преимущества.

 

Динамический виртуализованный катастрофоустойчивый ЦОД (см. рисунок) состоит из вычислительной инфраструктуры под управлением VMware Infrastructure и системы хранения NetApp Metro Cluster под управлением операционной системы Data ONTAP, в которую «зашита» логика работы распределенной системы хранения.

 

При выборе серверов для построения вычислительной инфраструктуры мы рекомендуем решения Dell. Продукты этой компании еще не достаточно оценены в России, но, по нашему мнению, они наилучшим образом отвечают требованиям стандартизации ИТресурсов. Dell не выпускает уникальных и «закрытых» продуктов, а предлагает массовые тиражируемые решения на основе индустриальных стандартов.

 

Для обеспечения виртуализации вычислительной инфраструктуры динамического ЦОДа используются решения VMware, поскольку они поддерживают все современные возможности виртуализации. Так, вычислительная инфраструктура под управлением программного пакета VMware Infrastructure 3.5 независимо от количества используемых серверов представляет собой единую систему. При этом совершенно неважно, на скольких площадках она работает. Сервисы, обеспечивающие высокую доступность и динамическую балансировку нагрузки, функционируют независимо от того, на какой площадке физически расположены серверы. Виртуальные машины могут «перемещаться» с площадки на площадку без остановки сервисов, и на решении задач бизнеспользователей это никак не отразится.

 

Для организации виртуализованной системы хранения в случае, если есть возможность использовать две технологические площадки в пределах «городского» расстояния, идеально подходит NetApp MetroCluster. В отличие от схожих решений других производителей, NetApp создает, по сути, единое хранилище данных, которое тем не менее распределено между двумя технологическими площадками. При этом серверы на технологических площадах ничего «не знают» о том, как на самом деле распределены между ними данные – они работают с единым хранилищем. Это значительно упрощает разработку логики поведения в чрезвычайных ситуациях. Уже не нужно создавать сложные алгоритмы, определяющие приоритетность устройств хранения в том или ином случае, – система хранения только одна и вся логика ее работы «зашита» внутри ее ПО.

 

Тот факт, что ресурсы на самом деле распределены между двумя технологическими площадками, не оказывает влияния на работу ЦОДа. При выходе из строя любого из серверов на любой из технологических площадок инициируется стандартная процедура обработки сервиса высокой доступности VMware Infrastructure – все виртуальные машины перезапускаются на доступных серверах. В случае выхода из строя всех серверов на одной из технологических площадок виртуальные машины перезапускаются на другой технологической площадке до тех пор, пока там есть свободные вычислительные ресурсы. Поддержание свободных вычислительных ресурсов – задача администратора. При этом различные виртуальные машины имеют различный приоритет, и тем обеспечивается очередность: наиболее важные для бизнеса сервисы будут «подниматься» в первую очередь, а второстепенные – во вторую.

 

В случае катастрофы на системе хранения мы имеем зеркально реплицированные данные на другой технологической площадке и серверы «не заметят», что одна половина зеркала перестала функционировать. С их точки зрения работа будет продолжаться как и прежде.

 

Если выйдет из строя технологическая площадка целиком (все серверы и часть системы хранения, расположенные на одной площадке, перестанут нормально функционировать), останутся серверы и зеркальные данные на резервной площадке. Все ИТ-сервисы могут быть быстро запущены на ней по нажатию клавиши администратора системы.


 . . . 


Таким образом, динамический виртуализованный ЦОД, основанный на NetApp MetroCluster и VMware Infrastructure, предоставляет все преимущества, которые дают виртуализация и консолидация ИТ-ресурсов. Он обеспечивает катастрофоустойчивость и, в отличие от стандартных кластерных решений на базе двух отдельных систем хранения, сохраняет простоту настройки и эксплуатации.

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!
Поделиться: