Rambler's Top100
 
Статьи
Юрий ДРАБКИН  10 апреля 2017

Как Schneider Electric действительно снижает ТСО дата-центра

Нужно оценивать общую стоимость владения ЦОДом, выявлять и устранять проблемы, увеличивающие расходы на его эксплуатацию, считает Юрий ДРАБКИН, консультант по сопровождению жизненного цикла инфраструктуры ЦОД компании Schneider Electric. 

Юрий ДРАБКИН

– Юрий, на что в первую очередь обратить внимание заказчику, который решил построить ЦОД?

– Прежде всего следует оценить общий объем затрат, который будет состоять из капитальных (CAPEX) и операционных (OPEX) расходов. У нас на рынке неплохо оценивают CAPEX. Есть много интеграторов, которые имеют опыт строительства ЦОДов, есть компании, которые знают, как сделать это хорошо. Но очень мало кто работает с операционными расходами.

Проблема в том, что обычно у заказчика капитальными и операционными расходами занимаются разные структуры. Капитальные расходы находятся в ведении департамента развития, или департамента капитального строительства, или департамента операционных рисков. Операционной деятельностью занимаются люди из департамента обслуживания, которые находятся в ведении АХО или директора по ИТ и подчиняющихся ему служб поддержки.

Кроме того, мало кто в существующих ЦОДах трезво оценивает операционную часть расходов, особенно в дата-центрах, построенных десять лет назад. Директор по эксплуатации имеет информацию о текущих расходах. Строители и департамент развития знают капитальные затраты. Но только люди, руководящие и теми, и другими, могут корректно оценить ТСО – совокупную стоимость владения ЦОДом.

– А что входит в эту стоимость?

– За последние пару лет я оценивал более двух десятков проектов по созданию инженерной инфраструктуры ЦОДа. Три больших кита, которые играют ведущую роль в ТСО в части капитальных затрат, – это энергетика, охлаждение и автоматизация. Расходы на противопожарные системы, канализацию, охранные и другие системы относительно небольшие. Операционные расходы можно разделить на три основные части: затраты на электричество, на персонал службы эксплуатации и на все остальное (SLA-контракты, сопровождение систем и т. д.).

– И каким образом можно снизить ТСО дата-центра?

– Предложение, с которым мы вышли на рынок, – использование аппаратных и программных компонентов системы DCIM (Data Center Infrastructure Management) как инструмента для управления ТСО. Именно внедрение софта как средства оптимизации TCO является нашим ноу-хау, которого сейчас нет ни у кого в мире. Мы действительно снижаем стоимость эксплуатации дата-центра, повышаем отдачу от CAPEX, увеличиваем скорость принятия и реализации решений в управлении инфраструктурой.

Например, у крупного телеком-оператора появилась задача: за два месяца добавить в ЦОД 300 стоек. Наше решение позволило ему это сделать, хотя при классическом подходе – подготовка, проведение тендеров и строительство – проект занял бы два года. У другого заказчика мы всего за две недели внедрили пилотный проект, увеличив утилизацию стоечного пространства и снизив PUE ЦОДа с 1,6 до 1,4.

– Расскажите об основных шагах внедрения системы.

– Первые несколько встреч – это общение с представителями заказчика и выяснение того, какая на самом деле стоит перед ними задача и что требуется в результате. Правильное понимание задачи – это уже половина ее решения.

Заказчики, как правило, не просят сократить операционные расходы. Люди говорят: «Что-то у нас кондиционеры плохо работают». Или: «Мы строили ЦОД по 7 кВт на стойку, а больше 4,5 кВт поставить не можем. Когда начинаем добавлять – возникают зоны перегрева. А по проектной документации все хорошо, и на стойку можно подвести и 7, и 10 кВт».

Далее, после того как понимаем задачу, мы проводим аудит. Это делает команда профессионалов: специалисты по охлаждению, по энергетике, по общей архитектуре ЦОДа. Смотрим ситуацию на объекте – где и что нужно измерить, что посмотреть, где выявить тонкие моменты. По результатам аудита выстраиваем 3D-модель, где смотрим метрики по электричеству, охлаждению, изучаем дизайн ЦОДа, формируем воздушные потоки и температурные карты машинного зала, выявляем локальные точки перегрева. По итогам анализа модели мы разворачиваем нашу DCIM-систему StruxureWare – центр управления инфраструктурой, включающий модули мониторинга инфраструктуры Data Center Expert и модуль управления активами ЦОДа Data Center Operation. После этих мер устанавливаем и меняем различные аппаратные компоненты и проводим обучение персонала работе с нашей системой с учетом ролей пользователей.

 

 

– В процессе работ вы строите компьютерную модель объекта?

– Мы строим компьютерную модель на основе наших замеров и при помощи нашего ПО. CFD-моделирование, с которым часто ассоциируется термин «компьютерная модель», – это полностью оторванная от жизни теория. Реальный ЦОД никогда так не работает. Поэтому мы и используем показания конкретных приборов, измеряем все параметры воздушных потоков, температур, энергетики – и переносим их в нашу модель. Видим реальную картинку ЦОДа, конкретные 3D-планировки с разрезами по температуре по слоям. И их анализируем.

Иногда даже оставляем приборы регистрации на длительное время (до двух недель), чтобы посмотреть динамику процессов и выявить все нюансы работы площадки, как они есть.

– А потом даете конкретное предложение по работам?

– После этого мы вспоминаем первичную задачу клиента. Мы говорим ему: «Вот что тебя беспокоило. Для решения задачи нужно сделать то-то и то-то». Но это не все. Например, по результатам конкретного обследования мы выяснили, что можно не просто поставить дополнительно пять юнитов в каждую стойку, а еще добавить в машзал 10 стоек – т. е. утилизировать CAPEX, средства, которые уже вложены.

Пусть ЦОД потребляет электричества на 100 условных единиц. Мы можем снизить расход до 80. Потом заказчик поставит стойки и увеличит этот показатель опять до 100. Соответственно, у него не будет лишних расходов, ни OPEX, ни CAPEX, но он сможет фактически на 20% увеличить отдачу от уже сделанных затрат.

Когда объясняешь это финансистам, они в восторге. А технари часто недопонимают, особенно специалисты, работающие в отрасли много лет, но с опытом классических проектов. Лет 20 назад в компаниях было несколько файл-серверов, которые стояли под столами в обычных комнатах. Потом их стали выносить в отдельные комнатки, но там все равно была небольшая удельная энергетическая плотность оборудования. А сейчас все по-другому. Идет цифровизация, миниатюризация, мощности располагаются все плотнее и плотнее. И появляются новые задачи, связанные с размещением десятков и сотен стоек, которые не всегда удается правильно и своевременно решить.

Причем это типичная ситуация. Заходим в обычный работающий ЦОД, смотрим, одна стойка забита патч-панелями. При этом в нее можно подвести питание, т. е. там стоят PDU на 7 кВт. Мощность на эту стойку запланирована, но она не используется. На соседней стойке стоят две блейд-корзины. Заказчик хотел бы их использовать, но PDU в ней тоже на 7 кВт, а корзина потребляет в среднем 6 кВт и две корзины одновременно утилизировать на полную мощность нельзя. Еще сложнее, как правило, бывает ситуация с охлаждением.

– А разве на этапе проектирования корзины не должны были разнести в разные стойки?

– Если ЦОД построили пять лет назад, а новые услуги и сервисы заказчика вводятся сейчас, то, к примеру, принимают решение, что под реализацию этих ИТ-сервисов надо поставить 20 блейд-корзин определенной конфигурации. И устанавливают необходимое бизнесу решение в существующую инфраструктуру. Могут поставить по две блейд-корзины в одну стойку и получается, что такую ИТ-инфраструктуру нельзя или очень сложно полностью утилизировать.

В одной стойке может не хватать юнитового пространства, в другой – электричества, в третьей – охлаждения: она стоит в ряду дальше всех от кондиционера, а в стойке с патч-панелями есть щели, и воздух от кондиционера идет не туда, куда требуется. Это совершенно реальные примеры.

– А как вы можете в этом случае помочь?

– По результатам аудита мы предлагаем конкретный список мер, которые же сами и внедряем. Например, так: плитка АБ-13 – заменить перфорацию с 33 до 66%; стойка Р-15 – установить 12 заглушек, заглушить отверстия между 19-дюймовым профилем и стенкой шкафа, установить систему изоляции воздушных потоков для воздушных коридоров ЦОД. И все это на работающей площадке, без остановки клиентских сервисов!

Но решение проблемы не в том, куда и как поставить заглушки. У нас более амбициозная задача: нам нужно донести до клиента, что у него есть много ресурсов, которые уже оплачены и которые он может переутилизировать. И мы подсказываем, как это можно сделать.

– Можно сказать, что вы занимаетесь оптимизацией операционных расходов ЦОДа?

– Я бы сказал, что мы занимаемся снижением общей стоимости владения. Чаще всего мы имеем дело не с новыми ЦОДами (с ними куда все проще), а с существующими площадками, и при этом стараемся заставить работать все вложенные средства, т. е. использовать существующий CAPEX по максимуму.

– А какие еще работы вы делаете для заказчика?

– До реорганизации мы устанавливаем системы мониторинга, датчиков, контроля климата. Если такие системы есть у клиента, то мы их используем. Если нет, то оснащаем щиты системами измерений, чтобы детально понимать ситуацию с электроснабжением, и фиксируем существующую картину до проведения изменений. Мы разворачиваем нашу DCIM-систему StruxureWare – центр управления инфраструктурой, включающий модули мониторинга инфраструктуры Data Center Expert и управления активами ЦОДа Data Center Operation. Многие компании на рынке предлагают такие решения в виде лицензий. Для нас же DCIM – это оптимизация бизнес-процессов заказчика.

Как минимум персонал должен использовать нашу DCIM-систему в существующих бизнес-процессах. Но часто мы уже на основании данных аудита вносим в них коррективы. Были примеры, когда у клиента обходами ЦОДа занимались четыре человека, а после выполнения наших работ и внедрения нашего решения для этих конкретных задач достаточно стало двоих. Фактически это изменение существующего бизнес-процесса. Ресурсы перераспределяются, и затраты на сопровождение и поддержание бизнес-процесса для клиента становятся меньше без снижения качества.

Мы обучаем персонал заказчика, осуществляем техподдержку оборудования и ПО, да и всего решения, которое внедряем. Мы готовы браться за всю задачу целиком, а не просто провести отдельные мероприятия: выполнить аудит, поставить кондиционер, установить систему изоляции воздушных коридоров или внедрить систему мониторинга.

Мы можем кастомизировать софт, установить и настроить его под бизнес-процессы заказчика. И именно этого на рынке больше никто не делает. Сейчас Schneider Electric предлагает решение DCIM как инструмент управления TCO. Это не эфемерное место в стойках или абстрактное снижение рисков. Мы действительно снижаем стоимость владения ЦОДом. 

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!