Rambler's Top100
Реклама
 
Статьи ИКС № 2 2023
Дэниел БИЗО  21 апреля 2023

Пожары в ЦОДах и литий-ионные АКБ

Частота пожаров не увеличивается по мере роста ИТ-нагрузки или количества ЦОДов, но они потенциально губительны для объектов и последующие отключения крайне негативно сказываются на бизнесе их владельцев и арендаторов. При этом риск возгорания литий-ионных аккумуляторов выше, чем VRLA АКБ.

Цена пожара

База данных об отказах (Abnormal Incident Reports Database), которую ведет Uptime Institute, свидетельствует, что пожары в ЦОДах происходят нечасто и редко оказывают существенное влияние на их работу. Всего с 2020 г. публично сообщалось о 14 случаях отключений ЦОДов, вызванных непосредственно пожарами или срабатыванием систем пожаротушения. Пожар произошел и 1 октября 2022 г. в многоэтажном дата-центре в Панге (к югу от Сеула). В нем пострадал второй по величине многопрофильный холдинг Южной Кореи SK Group. Оператором ЦОДа являлась «дочка» SK Group компания SK Inc. C&C. Согласно полицейским отчетам, пожар начался в аккумуляторном помещении, а затем быстро распространился на остальную часть здания. Пожарным потребовалось около восьми часов, чтобы взять пламя под контроль.

Хотя сообщений о пострадавших не поступало, этот инцидент может оказаться крупнейшим на сегодняшний день отключением ЦОДа, вызванным пожаром. Авария вывела из строя десятки тысяч серверов, включая не только собственные системы SK Group, но и ИТ-инфраструктуру, на которой работает самый популярный южнокорейский мессенджер KakaoTalk. Авария также привела к сбоям в работе интегрированной мобильной платежной системы, транспортного приложения, игровой платформы и музыкального сервиса. У всех этих служб миллионы пользователей. Отключения также затронули облачного гиганта Naver («южнокорейский Google»), который сообщил о сбоях в работе своих сервисов онлайн-поиска, покупок, ведения блогов и медиаплатформ.

SK Group еще не раскрыла основную причину пожара, но представители Kakao, компании – владельца KakaoTalk, винят во всем установленные на объекте литий-ионные аккумуляторы производства SK on, еще одной дочерней компании SK Group. В ответ SK Group опубликовала записи из системы управления аккумуляторами (BMS), свидетельствующие об отсутствии нештатных отклонений их параметров до инцидента. Однако некоторые местные СМИ утверждают, что на самом деле BMS сгенерировала многочисленные предупреждения.

Последствия отключения ЦОДа не ограничились перебоями в работе ИТ-сервисов и соответствующей потерей доходов их провайдеров. Полицейский рейд в штаб-квартиру SK Inc. C&C; отставка совладельца Kakao Вона Намкунга; создание национальной целевой группы по предотвращению аварий и катастроф с участием военных чиновников и национального разведывательного управления – тоже следствия этого пожара. Наконец, с заявлением выступил президент страны Юн Сок Ель, который пообещал провести тщательное расследование причин пожара и размера причиненного ущерба. 

Правительство Южной Кореи объявило о ряде мер, направленных на предотвращение крупномасштабных сбоев в работе цифровых сервисов. Все крупные ЦОДы теперь будут обязаны выполнять разработанные правительством процедуры предотвращения аварий, включая проведение регулярных проверок и учений по технике безопасности. Кроме того, Министерство науки и ИКТ страны будет поддерживать разработку аккумуляторных технологий, снижающих риск возникновения пожара, что представляет национальный интерес для Южной Кореи – страны, где находятся крупные производители литий-ионных элементов, включая Samsung SDI и LG Chem и саму SK on.

Пожар в Панге вызывает в памяти пожар в ЦОДе OVHcloud в Страсбурге в 2021 г. В том инциденте пострадали около 65 тыс. клиентов, многие из которых потеряли свои данные. Предполагалось, что причиной пожара, как и в Панге, были системы бесперебойного питания. По данным Французского бюро расследований и анализа промышленных рисков, распространению пожара способствовали отсутствие автоматической системы огнетушения, несвоевременное отключение электричества и особенности конструкции здания.

Вопрос финансовых потерь SK Group, Kakao и Naver еще предстоит решить. Пожар в ЦОДе OVHcloud, по оценкам, обошелся оператору более чем в 105 млн евро, причем страховкой было покрыто менее половины этой суммы. Цена пожара в Панге, вероятно, составит десятки (если не сотни) миллионов долларов.

ЛИ АКБ — повышенный риск?

С литий-ионными аккумуляторами сопряжен больший риск возгорания, чем со свинцово-кислотными АКБ с регулируемым клапаном (VRLA), независимо от особенностей их химического состава и конструкции. Это утверждение поддержано Национальной ассоциацией противопожарной защиты США и другими уважаемыми организациями. При разрушении элементов в литий-ионных батареях образуются горючие газы (включая кислород), поэтому огонь может бесконтрольно распространяться между элементами, по батарейным блокам и, возможно, даже по шкафам, если они не удалены на необходимое расстояние. Такие пожары очень сложно тушить.

Многие операторы ЦОДов до сих пор считали соотношение риска и выгоды от использования литий-ионных аккумуляторов, которые занимают меньшую площадь, имеют более длительный срок службы и пр., вполне приемлемым. Опросы ведущих поставщиков ИБП свидетельствуют о росте числа внедрений ЛИ АКБ в ЦОДах и промышленных системах: некоторые производители сообщают, что более половины своих основных трехфазных ИБП они уже поставляют с литий-ионными батареями. Согласно исследованию Uptime Institute за 2021 г., почти половина операторов ЦОДов используют такие АКБ в централизованных схемах ИБП – три года назад их было всего четверть. И проникновение литий-ионных аккумуляторов продолжает расти (см. рисунок).
Источник: Uptime Institute Intelligence
Рост популярности литий-ионных АКБ

Инцидент на объекте SK Inc. C&C подчеркивает важность выбора системы пожаротушения и локализации пожара как ключевых процедур обеспечения отказоустойчивости. Большинство нормативных актов, регулирующих предотвращение пожаров и смягчение их последствий, справедливо концентрируются на безопасности людей, а не на защите активов. Однако операторам ЦОДов необходимо учитывать другие критически важные вопросы, включая защиту оборудования, обеспечение непрерывности работы, а в случае аварии – минимизацию среднего времени восстановления.

Для замедления распространения пожара на ранних стадиях выхода из строя литий-ионных элементов эффективно газовое тушение (в сочетании с системами раннего обнаружения), но для ликвидации последствий крупного теплового выброса оно, возможно, подходит меньше. Вода и пена, вероятно, будут работать лучше. Размещение батарейных шкафов на большем расстоянии друг от друга может помочь предотвратить или ограничить распространение пожара. Разделение аккумуляторных помещений на огнестойкие отсеки (предусмотренное требованиями к отказоустойчивости уровня Tier IV) еще больше снизит риск отключения всего объекта.

Однако такие масштабные меры по предотвращению возгорания могут свести на нет преимущества ЛИ АКБ с точки зрения их более высокой объемной плотности энергии, меньшей потребности в охлаждении и меньшей стоимости владения на протяжении всего срока службы (особенно на тех объектах, где пространство имеет первостепенное значение).

Достижения в области литий-ионной химии и компоновки элементов аккумуляторов позволят решить проблемы эксплуатационной безопасности. Хороший пример — литий-железо-фосфатные (LFP) аккумуляторы, которые не выделяют кислорода при разложении. Более безопасные инновационные химические соединения, такие как натрий-ионные и никель-цинковые, вероятно, предложат более надежное решение проблемы безопасности (и экологичности) аккумуляторов. Но до их широкого распространения увеличение числа литий-ионных аккумуляторов в ЦОДах означает, что вероятность сильных пожаров — с потенциально тяжелыми финансовыми последствиями — может только расти.

Дэниел Бизо, директор по исследованиям, Uptime Institute Intelligence

Печатается с разрешения Uptime Institute.
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!