Rambler's Top100
 
Статьи ИКС № 07-08 2016
Заурбек АЛЕХИН  06 сентября 2016

Диспетчерское управление при эксплуатации инженерной инфраструктуры ЦОДа. Организация, задачи, условия

Для достижения своей цели – обеспечения бесперебойного функционирования ЦОДа – диспетчерская служба, управляющая эксплуатацией его инженерных систем, должна иметь высокую квалификацию, широкие полномочия и всю полноту информации об управляемом объекте.

Заурбек АЛЕХИН, независимый консультант

Под диспетчерским управлением мы будем понимать централизованную форму оперативного управления с использованием технических средств, сбора и обработки информации, а также оперативного контроля и регулирования производства, осуществляемую специализированной структурой или выделенным сотрудником (диспетчером).

Определяющие элементы диспетчерского управления:

• централизованный характер деятельности;

• ориентация на сбор и обработку информации, в том числе с применением специализированных средств;

• осуществление оперативного контроля и регулирования функционирования объекта.

Объектами контроля и регулирования могут быть производственное оборудование, потребляемые услуги, а также деятельность персонала.

При эксплуатации инженерной инфраструктуры (ИИ) ЦОДа полный перечень функций диспетчерского управления зависит от уровня автоматизации мониторинга и управления различными системами, но ключевыми традиционно остаются задачи координации и контроля исполнителей.

ЦОД – сложный объект, функционирование которого обеспечивается работой целого ряда систем, в том числе инженерных. Эти инженерные системы, в свою очередь, сами зачастую весьма сложны с точки зрения количества контролируемых параметров, возможностей и вариантов регулировки и устранения отказов. Развитая система мониторинга и управления (например, класса DCIM и/или BMS) многое может упростить, но полностью отказаться от участия в эксплуатационных процессах технического персонала пока не получается. Не секрет, что при организации работ наибольшие риски возникают на стыках и пересечениях зон ответственности сотрудников, поэтому важнейшей задачей диспетчерского управления остается координация исполнителей.

Еще более повышает роль координации зависимость функционирования ИИ ЦОДа от внешних услуг, в первую очередь от электроснабжения. Не менее важна и задача организации рабочего взаимодействия с потребителями услуг, особенно в аварийных ситуациях.

Диспетчерская служба

Одним из определяющих элементов диспетчерского управления как такового является диспетчерская служба. То есть именно от наличия диспетчерской службы (или выделенного диспетчера) зависит, будет ли управление именоваться диспетчерским. Требование организационной обособленности значимо не только из-за критичности деятельности данной структуры, но и из-за необходимости наделить ее достаточными для реализации поставленных задач полномочиями. Наилучшим вариантом для этого будет формирование в составе службы эксплуатации отдельного подразделения диспетчеров.

Конечно, сторонники процессного или матричного подхода могут возразить, что того же результата можно достичь путем грамотного прописывания зон ответственности всех участников эксплуатации в рамках отдельных процессов. Это верно, но, к сожалению, редко срабатывает в отечественных компаниях. А вот традиционная иерархическая модель с единым ответственным и с вертикальным подчинением знакома и понятна всем, действует надежно и в рассматриваемом случае вполне оправданна. Придание диспетчерской службе соответствующего статуса достигается путем прямого подчинения ее руководителя начальнику всей службы эксплуатации. Это позволяет не только снять многие вопросы относительно полномочий, но и обеспечить эффективную эскалацию в критичных ситуациях.

Даже в небольших ЦОДах, численность службы эксплуатации которых не превышает одного-двух десятков сотрудников, особую роль и статус диспетчеров желательно организационно обозначить. Возможно, для этого потребуется подобрать индивидуальный вариант, например создать единую диспетчерскую для всех уровней эксплуатации (инженерного, ИТ-инфраструктуры, прикладного). В любом случае все участники эксплуатации должны четко понимать, что есть выделенный диспетчер, его задача – управлять, координировать, организовывать взаимодействие и у него имеются на это полномочия.

При исполнении своих обязанностей диспетчерская служба взаимодействует с несколькими группами контрагентов.

Контрагенты диспетчеров

В первую группу контрагентов входят: персонал службы эксплуатации, осуществляющий текущие операции на объекте, и персонал привлекаемых к эксплуатационным работам поставщиков. Диспетчер имеет практически неограниченные права в отношении данной группы: он ставит задачи, контролирует их исполнение, принимает решение о прекращении тех или иных работ, направлении специалистов на другие участки и т.д. Конечно, это не означает, что диспетчер подменяет собой руководство службы эксплуатации, главного инженера, главного энергетика и других руководителей: общие планы работ, подготовка и назначение специалистов должны осуществляться ими. Но в ходе дежурства приоритет и полнота власти должны быть отданы именно диспетчеру, поскольку на нем персонально лежит обязанность организовать устранение нештатных и критичных ситуаций, а также обеспечить функционирование ИИ ЦОДа в целом.

Вторая группа – это внешние поставщики услуг, такие как электросети и водоканал, которые не работают непосредственно на объекте, но от действий которых зависит функционирование ЦОДа. К ним могут относиться различные коммунальные структуры (вывоз мусора, транспорт), поставщики топлива и др. С ними должно быть организовано оперативное взаимодействие, особенно для случаев возможных отклонений и нарушений в предоставлении услуг. Права диспетчеров в данном случае тоже должны быть достаточно широки для того, чтобы у партнеров не возникало сомнений в правомочности поступающих запросов. Хотя следует признать, что по сравнению с первой группой возможности диспетчера будут значительно скромнее. И это обязательно нужно учитывать при проектировании объекта, добиваясь снижения зависимости от внешних услуг путем технических решений.

Третья группа – это потребители услуг инженерной инфраструктуры ЦОДа. Как правило, это служба эксплуатации ИТ-инфраструктуры ЦОДа, хотя могут быть и иные. Цель взаимодействия в данном случае – в первую очередь обмен информацией о возможных нарушениях предоставления услуг и совместных шагах для снижения отрицательного влияния такого рода событий на прикладные системы. И в этом взаимодействии статус диспетчера должен соответствовать ожиданиям контрагентов, они должны быть уверены, что полномочий диспетчера достаточно для организации необходимых работ и достижения результата.

Эксплуатация ИИ ЦОДа vs предоставление ИТ-услуг

Методологической основой организации предоставления ИТ-услуг является библиотека ITIL. За более чем 20 лет применения воплощенных в ней идей в ИТ-сфере сложились устойчивые правила. Уже ни у кого не возникает сомнений в необходимости формирования IT-Service desk – единой точки контакта между пользователями ИТ-услуг и службой ИТ, ответственной за их предоставление. Конечно, велик соблазн применить данную модель и для эксплуатации инженерной инфраструктуры. Но, к сожалению, специфика последней не позволяет сделать это без серьезной адаптации, по ряду направлений требующей кардинального пересмотра состава выполняемых функций.

Одна из ключевых особенностей ИТ-услуг – почти полное отсутствие необходимости проведения персоналом ИТ-службы технического обслуживания и прочих регламентных работ. Это не означает, что такие работы вообще не нужны, но их характер допускает в большинстве случаев полную автоматизацию, и на долю персонала остаются только функции мониторинга, которые могут выполняться удаленно. С другой стороны, количество пользователей и, соответственно, количество возникающих у них запросов велико, что не только требует наличия выделенной службы Service desk, но и определяет ее основную направленность – помощь пользователям. К сожалению, одновременно это вольно или невольно накладывает и некоторые ограничения на уровень полномочий, а порой и на квалификацию персонала Service desk: зачастую службу позиционируют как начальный уровень в карьере ИТ-специалиста. Следует также понимать, что в подавляющем большинстве случаев ошибочные действия оператора Service desk не приведут к сколько-нибудь существенным проблемам для организации.

В эксплуатации ИИ ЦОДа многое не так. Во-первых, количество пользователей и предоставляемых услуг ИИ ЦОДа, как правило, невелико и измеряется единицами. Во-вторых, ключевые задачи, стоящие перед диспетчерской службой, требуют квалификации, которая позволит анализировать поступающую информацию и принимать решения по устранению возникших проблем. В-третьих, для исполнения своих задач диспетчерской службе предоставляются широкие полномочия и соответствующий статус. В-четвертых, от действий диспетчера зависит функционирование объекта в целом, и ошибки могут стоить очень дорого. Это также накладывает свои ограничения на пред­почтительную модель деятельности диспетчерской службы. В-пятых, задачи диспетчера не ограничиваются устранением аварий и обработкой запросов. Они существенно шире и направлены в первую очередь на обеспечение функционирования объекта, в том числе обеспечение своевременных регулировок оборудования, контроль плановых работ, управление дежурной сменой. Хотя контроль устранения аварий, безусловно, тоже входит в обязанности диспетчерской службы.

Из сравнения перечисленных аспектов работы ИТ-службы и службы эксплуатации ИИ ЦОДа следует однозначный вывод о невозможности простого переноса подходов к построению диспетчерской из области ИТ-услуг в область эксплуатации инженерных систем. Тем не менее при создании диспетчерских служб следует учитывать ряд полезных элементов, глубоко проработанных Service desk, в частности применение специализированных систем регистрации и управления запросами, модели эскалации, механизмы контроля качества предоставления услуг и др.

Требования стандарта

Перечисленные нами идеи и подходы нашли отражение в проекте национального стандарта «Центры обработки данных. Инженерная инфраструктура. Операционная модель эксплуатации. Спецификация». Цель процесса диспетчерского управления проект определяет как «обеспечение общего оперативного управления и координации текущего взаимодействия персонала службы эксплуатации и привлекаемых внешних ресурсов в ходе реализации задач эксплуатации ЦОД».

В рамках процесса диспетчерского управления должны осуществляться следующие мероприятия:

• организация работы дежурной смены;

• обеспечение функционирования объекта в соответствии с установленными требованиями;

• контроль соответствия функционирования объекта требованиям;

• принятие оперативных мер по ликвидации нарушений в функционировании объекта;

• контроль качества предоставления услуг внешними поставщиками и принятие оперативных мер в случае отклонения качества услуг;

• контроль за соблюдением технологий обслуживания объекта;

• обеспечение соблюдения требований техники безопасности на объекте.

Помимо этого в проекте стандарта перечисляются ключевые условия, без которых процесс не сможет достичь поставленной цели:

• процессу должна быть доступна информация о текущем состоянии объекта (в консолидированном или развернутом виде, из всех имеющихся источников);

• процессу должны быть доступны планы работ по различным направлениям эксплуатации ЦОДа;

• процессу должна быть доступна актуальная информация об имеющихся ресурсах и поставленных им задачах;

• процессу должны быть доступны списки исполнителей, допущенных к работам;

• должны быть разработаны и сформированы процедуры оповещения для различных ситуаций и разнообразных задач эксплуатации;

• должны быть сформированы все необходимые процедуры эскалации;

• процесс должен формировать оперативный отчет о состоянии ЦОДа, произошедших событиях и выполненных (выполняемых) работах.

Выполнение перечисленных требований позволит обеспечить координацию и взаимодействие при эксплуатации ЦОДа, создать действующие и понятные исполнителям процедуры оповещения и взаимодействия.

* * *

Диспетчерское управление – ключевой процесс в организации эксплуатации ИИ ЦОДа. Его создание требует четкого обозначения стоящих перед диспетчерами задач, формирования условий для получения необходимой для их решения информации, создания процедур взаимодействия. Характер задач и возлагаемая на диспетчерскую службу ответственность требуют высокой квалификации ее сотрудников и широких полномочий. Результатами такого подхода будут надежно функционирующий объект и управляемая служба эксплуатации, готовая к решению любых возможных проблем. 

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!