Rambler's Top100
Статьи ИКС № 7-8 2008
Алексей СОЛОДОВНИКОВ  28 июля 2008

Три кита надежности ЦОДа

Многим известны уровни надежности ЦОДов, так называемые Tier I, II, III и IV, каждому из которых соответствуют свои коэффициенты готовности инженерных систем со своим количеством «девяток». Опираются эти «девятки» надежности дата-центра на трех китов.

Алексей Солодовников«Железо»

 

Первый – это качественное оборудование, которое служит не ломаясь, с заданным временем наработки на отказ. С этим сегодня проблем нет: есть немало производителей надежного инженерного оборудования для дата-центров, к коим без ложной скромности можно причислить и компанию АРС.

 

Проектирование

 

Но чтобы обеспечить тот или иной уровень надежности ЦОДа, нужно его вначале грамотно спроектировать. Это второй «кит», и с ним пока есть проблемы. Строительство ЦОДов в России переживает сейчас тот период, который обычная строительная индустрия пережила лет пять назад. Тогда при создании офисных и элитных жилых комплексов много внимания уделялось отделке, в отличие от инженерных систем. В результате инвестор получал на выходе совсем не то, во что он вкладывал деньги первоначально: например, офисный комплекс класса не «А+», а «В», который предполагает существенно более низкую арендную плату. И это только из-за того, что не было выполнено полноценное проектирование, требующее по мировым стандартам 5–7% финансирования проекта в целом. Правда, с тех пор многие застройщики поняли, что такая экономия выходит боком, и теперь до начала строительства нанимают консультантов, выполняют проектирование и вкладывают в него серьезные средства.

 

С дата-центрами, к сожалению, ситуация иная. Многие наши российские заказчики искренне считают, что девять беременных женщин могут за месяц родить одного ребенка. По мировым нормам нужно сначала выделить полгода на проектирование и лишь после этого начинать закупку оборудования, строительство и т.д. Нет, мы сначала размещаем заказы на оборудование и только после этого ищем людей, которые бы все это быстренько «запроектировали». О затратах на проектирование в размере 5–7% стоимости ЦОДа речь вообще не идет: «Да вы что?! 0,5% за глаза хватит! А что там, собственно, проектироватьто? И так все понятно с системами бесперебойного питания и кондиционированием». Конечно, время – деньги, но без некоторых вещей обойтись нельзя, иначе в итоге рождается то, что работает, мягко говоря, не так, как планировалось, или не работает вовсе.

 

Проблема еще и в том, что у нас мало организаций, имеющих опыт проектирования современных дата-центров, особенно с учетом изменений в инженерных системах, которые произошли за последние 5–7 лет. У традиционных проектировщиков этого опыта просто нет, но коекакой опыт есть у инжиниринговых компаний и крупных системных интеграторов, у которых за последние годы появились инженерные отделы, занимающиеся проектированием и строительством дата-центров. А без опыта вышеупомянутых «девяток» надежности ЦОДа достичь нельзя. Мало того, рядом с каждым проектировщиком надо сажать по опытному «эксплуататору», ибо проектировщик, даже идеально владеющий теоретической базой, часто не до конца понимает, как его проектные решения будут выглядеть в процессе эксплуатации.

 

Человеческий фактор

 

И тут мы подходим к третьему «киту» надежности ЦОДа, а именно к роли человеческого фактора в процессе эксплуатации, а также к наличию (или отсутствию) в дата-центре систем автоматики, которые в критических ситуациях способны принять за оператора единственно правильное решение. Грамотный, обученный персонал, натренированный на отработку нештатных ситуаций, может повысить характеристики дата-центра и сократить среднее время простоя, соответствующее «официальному» уровню ЦОДа, а неграмотные действия службы эксплуатации могут запросто этот уровень опустить. Например, для дата-центра категории Tier III допустимое суммарное время простоя составляет 1,6 часа в год, и тем не менее есть площадки уровня Tier III, которые работают по пять лет без единого сбоя, и это заслуга службы эксплуатации. Нередко крупные западные хостинговые дата-центры проводят профилактические работы чаще, чем рекомендуют поставщики оборудования. Например, батареи ИБП рекомендуется «прозванивать» раз в год, а они делают это дважды в год. Включают резервный дизельгенератор и гоняют его под нагрузкой не раз в полгода, а каждые дватри месяца. Более того, они каждый месяц меняют солярку в баках, потому что при долгом хранении она портится. Есть еще масса вещей, которые надо делать в процессе эксплуатации, чтобы в нужный момент резервное оборудование сработало так, как положено.


 В России уже есть компании с большим опытом и грамотной службой эксплуатации именно современных ЦОДов, а не ведомственных машинных залов времен ЕС ЭВМ. Со временем таких профессионалов должно стать больше, а пока самый правильный путь – это использование имеющегося опыта западных компаний, изучение лучших мировых практик и привлечение экспертов наподобие Uptime Institute. Кстати, некоторые российские компании, которые собираются в обозримом будущем строить дата-центры, уже общаются с Uptime Institute и готовы привлекать его специалистов в качестве консультантов для своих проектов. Надеюсь, что это произойдет в ближайшие полгода-год.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!
Поделиться: