Rambler's Top100
Статьи ИКС № 10 2013
Евгения ВОЛЫНКИНА  14 октября 2013

ЦОДы ищут резервы эффективности

Российская индустрия цодостроения наращивает квадратные метры серверных залов, мегаватты потребляемого электричества, квалификацию проектировщиков и «эксплуататоров», КПД использования ресурсов... Но резервов повышения эффективности еще немало.

Как показала организованная журналом «ИКС» 8-я ежегодная международная конференция «ЦОД-2013», проектировать и строить дата-центры по всем правилам у нас уже умеют (или по крайней мере знают, как это делать). На повестку дня теперь выдвигается проблема столь же правильной эксплуатации построенных дата-центров.

Как на необитаемом острове

Закономерности и особенности – этой проблеме было посвящено представленное на конференции исследование «Организация эксплуатации и причины отказов в ЦОД», совсем недавно выполненное агентством iKS-Consulting. Правда, как отметил его управляющий партнер Константин Анкилов, в ходе опроса владельцев дата-центров и специалистов, занимающихся их эксплуатацией, им не задавали «самый интересный» вопрос о частоте отказов ЦОДов, поскольку было ясно, что это «коммерческая тайна». Тем не менее исследование дало достаточно реалистичное представление о ситуации в российских дата-центрах. В частности, оказалось, что главной причиной отказов в российских ЦОДах является человек (и этим мы ничем не отличаемся от остального мира): почти половина опрошенных считает, что как минимум в 80% случаев отказов в дата-центре виноват тот или иной специалист – сотрудник службы эксплуатации, специалист сервисной организации, проектировщик ЦОДа. Кроме того, исследование показало, что в 39% случаев в сбоях виноват сам персонал службы эксплуатации, а в 52% случаев вину в делят персонал дата-центра и сервисный подрядчик, ответственный за обслуживание того или иного оборудования. Минимизировать проблему у нас пока пытаются главным образом путем повышения квалификации персонала. Впрочем, как отметили участники специальной дискуссионной панели, посвященной эксплуатации и отказам в дата-центрах, уже растет понимание того, что для построения по-настоящему профессиональной службы эксплуатации нужно прежде всего максимально формализовать всю ее работу и все процедуры взаимодействия с сервисными подрядчиками.

  Валерий КУСТОВ директор по продажам компании «Минимакс Раша»   Алексей СОЛДАТОВ генеральный директор, DataPro  

Резервы для роста эффективности эксплуатации видны невооруженным глазом. В продвинутых западных ЦОДах (как и во всей ИТ-индустрии) царит тотальный аутсорсинг, и потому дежурный персонал даже крупных дата-центров можно сосчитать по пальцам одной руки. А у нас, по словам генерального директора компании DataPro Алексея Солдатова, эксплуатация большинства ЦОДов организована как на необитаемом острове – все стремятся иметь высококвалифицированный персонал, который «умеет всё». Причины опоры на собственные силы самые разные – от малого количества дата-центров в стране до отсутствия нормальных, по западным меркам, сервисных контрактов. Реальное (и прописанное в SLA) время реагирования аутсорсинговых компаний на неполадки для российских ЦОДов составляет сейчас 4 часа, тогда как вся индустрия мечтает о часовом SLA (но в условиях московских пробок это неизбежно потребует круглосуточного присутствия на объекте бригады «эксплуататоров» с соответствующей оплатой их работы). Снизить затраты на эксплуатацию может разработка подробных регламентов и инструкций, но с этим у нас тоже проблемы: простые инструкции, позволяющие неспециалисту в отведенное нормативом время отключить или перезагрузить сервер или другое оборудование – очень большая редкость. Правда, раз-работка таких реально работающих инструкций и регламентов пока, к сожалению, не является приоритетом номер один для владельцев дата-центров. Но те из них, которые хотят получить сертификат Uptime Institute Operational Sustaina-bility на службу эксплуатации, поневоле будут вынуждены сделать это.

   

Сложность обязывает

Формализация процедур и полное документирование работы всех систем и приложений актуальны в свете постоянно растущей сложности российских ЦОДов. Их усложнение особенно ярко видно на примере изменения моделей построения сетей дата-центров. Как рассказал руководитель направления продаж решений для ЦОД компании Cisco Олег Коверзнев, в большинстве российских дата-центров сети пока построены по традиционной трехуровневой модели (ядро – распределение – доступ) и управляются на уровне отдельных устройств. Но эта модель уже не соответствует требованиям к работе современных приложений и технологии виртуализации, а значит, те дата-центры, которые хотят предоставлять облачные сервисы, должны будут перейти на более современную модель построения сети – на основе матрицы коммутации, что дает возможность управлять не отдельными устройствами и портами, а логическими виртуальными ресурсами дата-центра с использованием централизованных политик. Такая модель позволяет в достаточно широких пределах масштабировать дата-центр, строить распределенные ЦОДы, управлять ими как единым централизованным ресурсом и обеспечивать перемещение виртуальных машин не только в пределах одной стойки, но и между дата-центрами, расположенными даже в разных странах мира. А на горизонте уже следующий этап эволюции сетей – программируемые сети SDN (software defined networks), в которых сами приложения будут определять состояние сети и ее функции по обслуживанию тех же приложений.

Олег Коверзнев руководитель направления продаж решений для ЦОД, Cisco     Александр Мартынюк, директор проекта ЕРЦОД, ОАО "Ростелеком" 

В ближайших же планах производителей – стандартизовать отдельные компоненты дата-центров и создать стандартные блоки, из которых эти дата-центры могут строиться. Например, компания Rittal предлагает несколько вариантов законченных решений RiMatrix S для инженерной инфраструктуры дата-центра на базе модулей Single 6 и Single 9, в состав которых входят серверные и сетевые 19-дюймовые стойки, системы электроснабжения, охлаждения и мониторинга. Как отметил руководитель технического проектного отдела Rittal Михаэль Николай, построение дата-центра из стандартизованных готовых модулей одновременно обеспечивает надежность работы ИТ-инфраструктуры, позволяет сократить затраты на построение и обслуживание дата-центра и дает возможность его масштабирования. Причем система RiMatrix S уже прошла предварительную сертификацию в организации TUV Rheinland, что должно облегчить процедуру полной сертификации ЦОДа в Uptime Institute.

Михаель НИКОЛАИ руководитель технического проектного отдела Rittal   Алок Кумар (Alok Kumar ), заместитель генерального директора, The Unique Identification Authority of India (UIDAI) 

Ну а чтобы сохранить построенное, необходима система пожаротушения, давно ставшая неотъемлемой частью любого сколько-нибудь серьезного дата-центра. Средств пожаротушения человечество разработало немало, и в дата-центрах используются самые разные тушащие вещества, но, как отметил директор по продажам компании «Минимакс Раша» Валерий Кустов, выбор правильного решения должен учитывать много факторов. Анализ случаев возгораний и их последствий показывает, что пожары, как правило, случаются спустя несколько лет после сдачи объекта в эксплуатацию, причем возгорание может причинить ущерб дата-центру даже в том случае, если очаг находится вне его. Кроме того, зачастую ущерб, наносимый средствами пожаротушения, превышает ущерб непосредственно от огня, а системы пожаротушения далеко не всегда работают в автоматическом режиме. Поэтому при их выборе надо найти баланс между стоимостью, эффективностью, надежностью и безопасностью для человека и оборудования ЦОДа: системы пожаротушения на основе аргона и азота подойдут для помещений с ИБП, где возможно возгорание металла, системы с углекислым газом справятся с возгоранием ДГУ, для серверных залов можно использовать хладон 227 или безопасный для человека Novec 1230.

Эффективность = облака

Эффективно работающая инженерная инфраструктура ЦОДа должна дополняться не менее эффективным использованием его вычислительных ресурсов. На сегодняшний день это означает облачную модель предоставления ИТ-сервисов и приложений. В частности, компания «Электронная Москва», дата-центры которой обслуживают городские электронные сервисы, предлагает заказчикам комплекс услуг для облачных приложений «ЦОД-интеллект», предусматривающий не только разработку и эксплуатацию облачных приложений, но и техническую поддержку развития этих приложений и управления их жизненным циклом. Как отметил директор по маркетингу «Электронной Москвы» Алексей Алексеев, последнее особенно важно, потому что немалую часть современных облачных приложений активно развивают их заказчики, что требует постоянной актуализации документации. Но даже при работе в «статическом» режиме заказчикам нужна качественная техническая поддержка с системой управления инцидентами и обработкой всех видов обращений пользователей (телефон, электронная почта, портал самообслуживания и т.п.), иначе об участии в конкурсах на предоставление сервисов серьезным государственным и корпоративным организациям можно будет забыть.

 

Облачное предложение компании Linxdatacenter тоже комплексное: ее облако LinxCloud, предоставляющее услуги IaaS, благодаря наличию у компании международной сети дата-центров подойдет и тем заказчикам, которые хотят размещать инфраструктуру только в России, и тем, которые хотят базироваться исключительно за рубежом. При этом Linxdatacenter гарантирует предоставление полной информации о местонахождении данных заказчиков в облаке, с точностью до диска конкретного дата-центра, и обеспечивает размещение этих данных в местах, определенных заказчиком в соответствии с требованиями законодательства или политиками безопасности. Так что облачные провайдеры уже нашли симметричный ответ на опасения заказчиков по поводу «туманности» размещения данных.

И уж совсем развеять их сомнения в безопасности использования услуг сторонних дата-центров берется компания Trend Micro. Консорциум Cloud Security Alliance рекомендует в качестве основного механизма защиты шифрование данных, которое, правда, не отменяет необходимости защиты серверов от традиционных атак. Но, как отметил технический консультант Trend Micro Денис Безкоровайный, главное для заказчика – это помнить, что безопасность в облаке есть результат совместных усилий провайдера и самого клиента, а ответственность за эту безопасность лежит исключительно на заказчике, который должен не только обеспечить защиту своих операционных систем и баз данных, но и проверить работу провайдера. И еще не надо забывать, что рост эффективности использования вычислительных ресурсов при переходе в облако и получение от этого экономической выгоды должны сопровождаться инвестированием в информационную безопасность как минимум части сэкономленных средств. Таким образом, эффективность получается «с оговорками», но, как известно, скупой платит дважды.

  

В России уже достигнут достаточно высокий уровень проектирования и строительства ЦОДов. Пришло понимание того, как важно сохранить грамотно построенный дата-центр путем его столь же грамотной и экономически эффективной эксплуатации. Осталось «только» максимально автоматизировать все процессы в ЦОДе, по возможности удалив из него слабое звено в виде человека, но это, по всей видимости, задача не самого ближайшего будущего. 

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!