Rambler's Top100
Статьи ИКС № 04 2010
Евгения ВОЛЫНКИНА  06 апреля 2010

Тратим или экономим? Мониторинг и автоматизация управления систем электропитания ЦОДов

Непрерывность работы дата-центра зависит от слаженной работы многих систем, нуждающихся в бесперебойном электропитании. Бесперебойность функционирования систем ИБП требует как минимум мониторинга их рабочих характеристик и как максимум – автоматизированной системы управления, интегрированной в единую АСУ ЦОДа.

При подготовке предыдущей статьи, посвященной системам бесперебойного питания для дата-центров (см. «ИКС» № 1–2’2010, с. 66–72), мы объявили «тендер» на создание проекта довольно крупного ЦОДа с подводимой мощностью более 1,5 МВт, чтобы выбрать для него систему бесперебойного электропитания. Однако бесперебойность – понятие относительное: рано или поздно выйти из строя может любой элемент любой системы. Но, как правило, случается это «не вдруг» – практически все серьезные неполадки и аварии начинаются с небольших отклонений от нормального режима работы. Своевременно выявить их позволяют системы диагностики и мониторинга, а корректирует работу систем и указывает персоналу на необходимость проведения регламентных или ремонтных работ уже система управления, степень автоматизации которой зависит от размера и класса надежности дата-центра, от желания и финансовых возможностей его владельца.

Почти обязательный мониторинг

В своих оценках необходимости мониторинга систем гарантированного и бесперебойного электропитания специалисты фактически единодушны: мониторинг нужен в любом случае, ведь основная его задача – оперативное получение объективной информации о состоянии критически важных систем объекта. Это позволяет быстро обнаружить и идентифицировать неполадки или потенциально опасные изменения режима работы ИБП, обеспечив при этом адекватное взаимодействие с нагрузкой (например, формирование команды на грамотное закрытие серверов). Поэтому технический эксперт компании Chloride Анатолий Маслов рекомендует строить систему полного мониторинга ИБП, аккумуляторных батарей и ДГУ. Он убежден, что таким способом заказчик сможет сэкономить: сократится количество простоев оборудования; появится возможность выявить и заменить бракованную батарею на ранней стадии, не доводя дело до серьезного ремонта и т.д. «Всегда приятно сознавать, что система, питающая такую важную нагрузку, находится под постоянным наблюдением, – говорит он. – Ведь вы же, к примеру, платите за систему мониторинга подушек безопасности в автомобиле».

«Применение систем мониторинга обусловлено требуемым уровнем надежности проектируемой или эксплуатируемой системы, а также ее стоимостью. Чем выше этот уровень, тем актуальнее использование централизованной системы мониторинга, которая в конечном счете позволяет дополнительно улучшить эксплуатационные характеристики системы», – считает Андрей Вотановский , специалист по системам бесперебойного питания из Emerson Network Power S.r.l. Ну и, конечно, без системы мониторинга трудно обойтись, если дата-центров несколько и расположены они в относительной близости друг от друга. В этом случае Евгений Назаренко , инженер-проектировщик из DATADOME, советует применять систему удаленного мониторинга и управления инженерными системами (SCADA-системы) через веб-интерфейс, что позволит уменьшить численность дежурного персонала и затраты на аренду помещений для смены. Кроме того, удаленный мониторинг снижает зависимость от человеческого фактора при оперативных переключениях (контроль действий дежурного персонала, защита от ошибочных операций) и подключении новых нагрузок (можно реализовать визуальную индикацию степени загруженности стойки). Грамотно организованная система мониторинга оповещает о приближающихся или наступивших аварийных ситуациях, ведет электронный журнал событий для последующего разбора аварий и т.д. К тому же нельзя не учитывать, что ее стоимость по сравнению с ценой ИБП невелика.

Юрий Наумов , руководитель отдела управления проектами компании «Verysell Проекты», предупреждает: если функции мониторинга и управления в ЦОДе отсутствуют, то рано или поздно система бесперебойного электроснабжения даст сбой, который может привести к долговременному простою в работе серверов. Ущерб, наносимый длительными простоями, различен: для банков, например, он исчисляется одними суммами, для организаций, сдающих место под серверы, – другими, но обычно его нельзя назвать незначительным. Есть реальные примеры, говорит Александр Ласый , технический директор департамента интеллектуальных зданий КРОК, когда об отсутствии питания в дата-центре даже в крупных и уважаемых компаниях узнавали лишь через несколько часов после произошедшей аварии. Казалось бы, на фоне таких аргументов меркнут любые доводы в пользу «экономии». И все-таки русское «авось» и стремление сэкономить «на спичках» нередко берут верх. По данным Константина Соколова , начальника отдела экспертизы «Абитех», системы мониторинга внедряются и эффективно используются в российских условиях в основном в двух ситуациях – при наличии у заказчика собственной высококвалифицированной службы эксплуатации и при заключении сервисного контракта с включением функции удаленного контроля состояния оборудования. Во всех остальных случаях они, как правило, вырождаются в установку плат SNMP-интерфейса для основного оборудования и получение аварийной информации дежурной службой для оперативного принятия решений. Кстати, большинство промышленных ИБП поддерживают обмен данными по SNMP и поэтому их можно состыковать с широким спектром имеющихся на рынке систем мониторинга, напоминает технический директор «ДатаЛайн» Сергей Мищук .

В комплекте от производителя

В принципе практически все современное компьютерное и сетевое оборудование имеет встроенные средства самодиагностики и мониторинга. Они есть даже в оборудовании начального уровня для домашних пользователей, не говоря уже о системах корпоративного класса.

Так, каждый сетевой ИБП Eaton комплектуется специальным ПО Intelligent Power Manager для удаленного управления всеми системами гарантированного электропитания корпоративной ИС, имеющими сетевой интерфейс. Причем это ПО поддерживает не только ИБП, но и модули распределения электропитания ePDU, датчики параметров окружающей среды и другое оборудование инфраструктуры электропитания. С помощью бесплатной базовой версии Intelligent Power Manager можно следить за работой до 10 устройств, а в платной версии ограничений на их количество вообще нет. Причем с помощью SNMP-протокола и сервиса XML Web можно проводить мониторинг ИБП других производителей. Настраиваемый пользовательский русскоязычный интерфейс позволяет осуществлять мониторинг нескольких ИБП Eaton в одном окне, менять вид отображения параметров, задавать функции управления аварийными предупреждениями и выбирать способ их доставки оператору. Все события и действия сохраняются в системном журнале. Как утверждает Денис Андреев , возглавляющий департамент ИБП компании Landata, ПО Intelligent Power Manager позволяет существенно снизить эксплуатационные расходы ЦОДов.

С помощью системы мониторинга LIFE.net компании Chloride можно предсказать грядущий сбой. По словам А. Маслова, более чем за 15 лет, прошедших с момента выпуска системы LIFE.net, удалось накопить обширную электронную библиотеку параметров, предшествующих тому или иному сбою. Благодаря этому можно реагировать не на сам сбой, а на изменение параметров, которое может привести к нему. Сервис удаленной диагностики LIFE.net позволяет делегировать мониторинг систем бесперебойного электропитания экспертам сервисного центра Chloride, работающим 24 часа в сутки. Они информируют клиентов о возможных сбоях и предлагают оптимальный вариант выхода из сложившейся ситуации.

Компания АРС поставляет свои ИБП с программами контроля состояния и зарядки аккумуляторных батарей, причем, как указывает руководитель отдела департамента сетевой интеграции ЛАНИТ Юрий Гурковский , все получаемые данные можно передать через SNMP-адаптер по сети на пульт оператора или в систему мониторинга.

Специальное ПО для мониторинга и управления своими ИБП имеет и компания Socomec. Программа TOP VISION позволяет контролировать работу одного или нескольких ИБП, отображая их состояние на мнемосхеме. Это ПО выводит на монитор оператора результаты измерений параметров работы ИБП и графики потребляемой ими мощности, ведет журнал событий и подает аварийные сигналы. А благодаря встроенному в TOP VISION веб-серверу можно получить удаленный доступ к любому оборудованию, подключенному к корпоративной сети, добавляет Наталья Маркина , коммерческий директор представительства Socomec в России.

Внутренняя система диагностики и отображения неисправностей есть и в ИБП Conceptpower Modular (производитель – Newave, Швейцария), предлагаемых для оснащения дата-центров компанией «ТЕСЛИ».

С помощью ПО Liebert Nform компании Emerson Network Power S.r.l с одного рабочего места можно осуществлять мониторинг и дистанционное управление по протоколу SNMP не только ИБП Liebert, но и ИБП других производителей, а также, подчеркивает А. Вотановский, отслеживать все процессы, касающиеся электропитания оборудования дата-центра, климатические параметры ЦОДа и оперативно реагировать на все аварийные ситуации.

Автоматика локальная и глобальная

В общем, мониторинг ИБП, по сути, стал уже функцией по умолчанию, необходимость которой не оспаривается. Что же касается систем автоматизированного управления ИБП, то они пока не дошли до той же степени признания в профессиональном сообществе. С одной стороны, иметь такую систему как минимум не вредно, с другой – необходимость ее создания во многом зависит от характеристик ЦОДа и организации его эксплуатации.

Как выразился Владислав Яковенко , менеджер проектов из компании КОМПЛИТ, «если в дата-центре отсутствуют системы дистанционного мониторинга, то не вы управляете дата-центром, а дата-центр управляет вами». Чуть менее категоричен Олег Зябрев , руководитель направления ЦОД APC by Schneider Electric. Он считает, что автоматика в основных инженерных сетях (электроснабжения, холодоснабжения и кондиционирования) ЦОДа в принципе нужна всегда, но в определенных случаях (обычно если ЦОД не очень мощный) может хватить и локальной автоматики, т.е. той, которую можно купить у производителя в комплекте с приобретаемым основным оборудованием. Например, в некоторых случаях поставляемое вместе с ИБП программное обеспечение позволяет не только осуществлять мониторинг, но и производить некоторые минимальные действия. При небольших мощностях инженерных систем и их простой конфигурации таких встроенных средств вполне хватает для управления процессом эксплуатации инженерных систем ЦОДа. Но с ростом мощности и/или отказоустойчивости инженерных систем ЦОД одной локальной автоматикой уже не обойтись. Требуется отдельная система управления технологическим процессом – АСУТП, которая будет согласованно управлять взаимодействием оборудования различных систем ЦОДа. Это связано с ростом мощностей и токов, увеличением парка оборудования и непростыми схемами его включения, ростом количества точек, которые нужно мониторить и которыми нужно управлять. Усложняются алгоритмы такого управления, а для этого уже необходима специальная система.

Для предложенного проекта ЦОДа с категорией надежности Tier III и подводимой мощностью от 1,5 до 3 МВт локальных систем будет недостаточно. Здесь, по мнению О. Зябрева, не обойтись без отдельной АСУТП – в противном случае дата-центр либо совсем не сможет работать в требуемых режимах, либо периодически будет выходить из строя, а это означает, что потери на простоях очень скоро превысят затраты на построение самой АСУТП, и серьезные инвесторы это отлично понимают. В частности, АРС предлагает применять систему централизованного контроля и мониторинга инженерной среды APC InfraStruXure Central, с помощью которой можно отслеживать нагрузки на инженерные системы и по мере их накопления напоминать службе эксплуатации о необходимости добавления соответствующих модулей, выбирать оптимальные места установки нового оборудования, а также выполнять другие задачи, позволяющие снизить расходы на этапе эксплуатации.

А вот С. Мищук считает, что полезность и экономическая целесообразность автоматизированного управления для эксплуатации системы бесперебойного электроснабжения неочевидны, и прежде чем решиться на ее внедрение, необходимо подготовить подробное технико-экономическое обоснование, провести анализ рисков, а кроме того, неплохо бы ознакомиться с положительным опытом эксплуатации и услышать отзывы пользователей. Очевидный плюс автоматизированной системы управления электропитанием – возможность быстрой реакции на аварию: оператору не нужно никуда бежать, он может все переключить с пульта (кстати, для ручного переключения некоторых автоматов нужно усилие в несколько десятков килограммов, и моторизованный привод добавит как скорости, так и комфорта). Но есть и минус: в полностью автоматизированной системе цена ошибки оператора может оказаться очень высокой (в связи с чем вспоминается известный анекдот времен холодной войны про последствия того, как кто-то «бросил валенок на пульт»).

  


Конечно, пока системы электропитания дата-центра работают более-менее нормально, зависимость между наличием систем мониторинга и автоматизации управления и сокращением затрат на эксплуатацию в общем-то не всем заметна (зато главный пост системы управления с большими красивыми мониторами выглядит очень эффектно, и его можно с успехом демонстрировать начальству, гостям и клиентам). Но, как известно, профилактика обходится дешевле лечения, особенно если речь идет о «лечении» такого дорогостоящего объекта, как крупный дата-центр. Достаточно одной сколько-нибудь серьезной аварии, чтобы небольшая экономия обернулась крупными убытками.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!