Rambler's Top100
Реклама
 
Статьи ИКС № 04 2014
Заурбек АЛЕХИН  Дмитрий БАСИСТЫЙ  08 апреля 2014

Служба эксплуатации российского ЦОДа. Портрет в интерьере XXI века. Часть 2

Последние штрихи – и портрет готов. Теперь, вглядываясь в черты «объекта», можно искать в нем хорошее и плохое, сопоставлять с идеалом, пытаться понять, как сложится его судьба.

Заурбек АЛЕХИН, независимый консультант 
 Дмитрий БАСИСТЫЙ, независимый консультант
Ресурсы  

Персонал

Автоматических процессов эксплуатации не существует, любой из них требует участия персонала. Персонал службы эксплуатации ЦОДа – важная часть операционной модели, критичный тип ресурсов, недостаточное внимание к которому приводит к усилению факторов, повышающих частоту отказов и аварий.

Вопросы, связанные с персоналом службы эксплуатации ЦОДа, можно разделить на три категории: численность персонала, квалификация, обучение.

С проблемой численности персонала сталкиваются практически все российские ЦОДы. Как показывают исследования, основные ее причины – минимизация операционных расходов ЦОДа и нехватка квалифицированных специалистов на рынке.

Проблему нехватки персонала в службе эксплуатации решают в основном двумя способами: заключая  сервисные контракты и повышая уровень квалификации сотрудников. Третий возможный путь – добиться высокой слаженности работы по подготовленным регламентам – пока еще не снискал популярности среди менеджеров служб эксплуатации дата-центров.

Поскольку научный подход к проектированию процессов эксплуатации не распространен в российских ЦОДах, в подавляющем их большинстве ориентируются на личный опыт менеджеров, на которых возложена ответственность за эксплуатацию. Последние же в оценках необходимой численности службы эксплуатации и ее структуры ориентируются на свой предыдущий опыт. Отметим здесь и еще одну важную проблему, связанную с квалификацией персонала: полностью формализовать квалификационные требования к сотрудникам не удается. В результате имеет место субъективный подход менеджеров ЦОДа при принятии решения о приеме специалистов на работу.

Проблему квалификации персонала службы эксплуатации не удается обойти ни одному ЦОДу. Либо приходится делать ставку на аутсорсинговую модель и тогда уже решать вопросы финансирования услуг внешних подрядных организаций и вопросы взаимодействия с ними, либо – даже при смешанной стратегии эксплуатации, своими силами с привлечением сервисных организаций – заниматься повышением квалификации персонала: его обучением и контролем качества знаний.

В нынешней действительности, как оказалось, сложился стандарт де-факто на частоту обучения персонала: два раза в год. При этом большинство менеджеров российских ЦОДов готовы мириться с тем, что обучение будет проходить с отрывом от производства – в специализированных учебных центрах. Вместе с тем немалая часть менеджеров мечтает об организации обучения на территории самих дата-центров, что называется, без отрыва от производства. Причины вполне прозрачны – менеджерам хотелось бы снизить время реакции обучающегося на возможный инцидент в ЦОДе (с отрывом от освоения новых знаний, конечно), но с точки зрения качества и полноты обучения есть серьезные аргументы «против».

В подавляющем большинстве российских ЦОДов понимают важность планового подхода к вопросам обучения персонала – план обучения и следование ему стали хорошей практикой.

Технологии и инструменты

Вопрос о специальных инструментах для обслуживания более-менее решен в большинстве российских ЦОДов. Если в ЦОДе придерживаются стратегии передачи оборудования на обслуживание вовне, проблема инструмента перестает быть проблемой службы эксплуатации. Для стратегии с опорой на собственные силы (которой, кстати, следуют далеко не в большинстве российских ЦОДов) решение вопроса со специальным инструментом – обязательная часть стратегии.

Отрадно осознавать, что инструментарий мониторинга и управления инженерными системами стал неотъемлемой частью ландшафта эксплуатации российских ЦОДов. С одной маленькой оговоркой: по сути внедренные системы мониторинга и управления – всего лишь системы мониторинга, полноценных функций управления в них немного. Это одна из специфических черт подхода к эксплуатации в российских дата-центрах.

Несомненным прорывом в сознании эксплуатантов стоит считать то, что подавляющее большинство менеджеров признают наличие зависимости частоты отказов от уровня автоматизации: чем выше автоматизация, тем реже отказы. В этом ряду эволюции остается сделать последний шаг – перестать бояться удаленного управления инженерными системами.

Системы управления эксплуатацией – относительно новый класс систем для российской отрасли ЦОДов. Новизна его настолько высока, что ЦОДов, в которых развернуты и используются системы управления эксплуатацией, насчитывается не более полудюжины. Это вполне закономерно: в борьбе за бюджет создания ЦОДа, как правило, удается отстоять систему мониторинга и управления инженерными системами, а вот возбудить интерес к будущей эксплуатации и системам управления ею не удается.

Информация

К ней относятся такие категории, как данные об объекте и работающих в нем системах, документация производителей на оборудование и его обслуживание, процессные инструкции и многое другое.

Начальная порция информации об объекте и его системах содержится в эксплуатационной документации. К сожалению, большинство российских ЦОДов либо вовсе не имеют эксплуатационной документации, либо актуальность ее такова, что она становится совершенно бесполезной. Это очень серьезная проблема, которая усугубляется еще и тем, что в ЦОДах не уделяют внимания актуализации документации на системы в процессе эксплуатации: вносимые после перенастроек оборудования изменения не фиксируются документально.

Документация производителей на оборудование, поставляемая вместе с ним, есть практически у всех ЦОДов, и это отрадный факт, но мануалы не в состоянии заменить полноценную эксплуатационную документацию, подготовленную разработчиком системы (проектировщиком) и организацией – наладчиком систем (субподрядчиком).

В условиях, когда нет традиции формализовать процессы эксплуатации – проектировать их, разрабатывать регламенты и ролевые инструкции, – надеяться на наличие этих процессов на объектах эксплуатации не приходится.

Финансы

От финансового обеспечения эксплуатации ЦОДа зачастую зависит, какой подход к эксплуатации будет применяться. Конечно, в большинстве случаев представители служб эксплуатации заявляют о недостатке выделяемых средств для качественного обслуживания. Это естественно: редко кто готов признать, что денег слишком много или что они расходуются не совсем эффективно. Но тем не менее не стоит воспринимать их заявления излишне поверхностно.

Говоря о финансировании, следует помнить как минимум о нескольких аспектах проблемы, в том числе – об объеме средств, выделяемых на эксплуатацию, структуре статей бюджета, процедурах исполнения бюджета, зависимостях между отдельными статьями и в рамках бюджета организации в целом.

Основные статьи расходов – это коммунальные платежи (главным образом, конечно же, плата за электроэнергию), оплата труда персонала и привлекаемых внешних подрядчиков. Прочие статьи, включая обеспечение ЗИП и расходуемыми материалами или обучение персонала, приоритетными зачастую не считаются. Традиционно при возникновении непредвиденных затрат или изменении экономических условий вторая группа статей наименее защищена от секвестра. Но и в первой группе не так уж все хорошо: как правило, разного рода сокращения не касаются только коммунальных платежей, поскольку правила «а иначе – отключим» никто не отменял.

Таким образом, мы имеем картину скорее не общего недостатка средств, а их структурно-неравномерного распределения и, как следствие,  существенного недофинансирования как бы неприоритетных направлений. Добавим, что в целом применяемая оценка приоритетности не является корректной, строится скорее исходя из ощущений или с позиции силы, тем самым создавая действительно серьезные проблемы и риски при эксплуатации.

Например, в среднего размера ЦОДе коммунальные платежи превышают потенциальные затраты на обучение персонала в сотни раз. Тем не менее руководители бизнеса часто с легкостью исключают последние в ходе исполнения бюджета, экономя на общем фоне копейки и своими руками создавая условия, в которых персонал, не имеющий необходимой подготовки, своими неправильными действиями может нанести ущерб на миллионы (то же справедливо и в отношении планового ремонта, который, напомним, должен осуществляться до возникновения аварии, а не после…).

Стоит упомянуть еще об одной частой проблеме: почти все отечественные компании работают в годовом цикле, который начинается в январе и заканчивается в декабре. Именно в декабре становится понятен финансовый результат по году и окончательно определяются допустимые параметры затрат. Соответственно, многие финансовые менеджеры стараются под разными предлогами оттягивать некритичные, на их взгляд, платежи ближе к концу календарного года. Однако по многим статьям бюджета ЦОДа исполнение работ требует времени, не говоря уже о необходимости предварительного заключения договоров. Таким образом, даже в случае фактического выделения средств в конце года редко когда эти средства могут быть потрачены эффективно и по назначению.

Для непрерывного бизнеса, каковым является эксплуатация ЦОДа, такого рода неравномерности создают дополнительные проблемы. Хотя, справедливости ради, следует сказать, что проблема конца года характерна для отечественной экономики в целом, и было бы странно, если бы она отсутствовала в отдельно взятой отрасли.

Quo vadis, Domine?

Итак, придерживаясь выбранной операционной модели эксплуатации ЦОДа и базируясь на полученных в ходе исследования данных, мы составили портрет среднестатистической российской службы эксплуатации ЦОДа. Вот ее основные черты:

  • В корпоративных дата-центрах часто отсутствует единая служба эксплуатации, нет одного ответственного за функционирование ЦОДа в целом. Ответственность за инженерную инфраструктуру в ряде случаев тоже разделена между различными службами.
  • Процессы управления и взаимодействия в целом обозначены, но глубина и полнота их реализации отвечают начальному уровню, формирование и развитие этих процессов остается прерогативой самой службы эксплуатации.
  • Процессы обслуживания организованы в соответствии с пониманием представителей службы эксплуатации, их опытом и квалификацией. Ориентация на нормативы и требования производителей не является установившимся стандартом, преобладают собственные методики и оценки.
  • Обеспечивающие процессы редко ориентированы преимущественно на потребности эксплуатации объекта. Формализация части процессов практически отсутствует, в том числе и для столь значимых процессов, как контроль качества исполнения работ и документирование.
  • Дата-центры комплектуются персоналом в недостаточном для нормального обслуживания объеме; формализованные квалификационные требования зачастую отсутствуют. Подготовка персонала ведется, но единого подхода к управлению квалификацией нет.
  • Применение специализированных технологий для организации обслуживания ЦОДа встречается редко, за исключением средств мониторинга и управления инженерными системами. Степень автоматизации управления остается невысокой, хотя имеется положительный тренд.
  • Документация по объекту и процессам эксплуатации в лучшем случае существует в виде комплекта проектных документов, без надлежащей актуализации. Часто документации вообще нет, знания о системах – в основном в головах специалистов.
  • Финансирование эксплуатации ЦОДа как выделенная дисциплина отсутствует, имеют место финансовые проблемы, общие для отечественных компаний разных отраслей.

В целом можно сказать, что общая зрелость эксплуатации ЦОДа как вида деятельности в нашей стране пока остается на невысоком уровне. Представители отрасли в теории правильно понимают, как должна выглядеть идеальная эксплуатация. К сожалению, пока по разным причинам полноценного воплощения теоретических знаний достичь не удается. По крайней мере, такой вывод следует из данных, полученных в ходе исследования ЦОДов.

В то же время общая зрелость понятий у представителей отрасли, давление рынка, стремление к эф-фективности, понимание проблем и задач эксплуатации позволяют осторожно надеяться, что в целом развитие идет в правильном направлении и ситуация в ближайшие годы будет улучшаться. Этому способствует и формирование эксплуатационной дисциплины, и увеличение числа учебных курсов теоретической и практической направленности, и постепенная стандартизация подходов и к проектированию, и к обслуживанию дата-центров во всем мире и в нашей стране.  икс 

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!