пн-пт: 9:00 - 17:30
Заказать звонок
Распродажа

Обеспечение резервного питания в ЦОД

Electroff
Представьте себе: в крупном городе внезапно гаснет свет. Для большинства это просто неприятность – погаснут лампы, остановятся лифты. Но для современного центра обработки данных (ЦОД) даже секунда без электричества может обернуться катастрофой.

Представьте себе: в крупном городе внезапно гаснет свет. Для большинства это просто неприятность – погаснут лампы, остановятся лифты. Но для современного центра обработки данных (ЦОД) даже секунда без электричества может обернуться катастрофой. Тысячи работающих серверов могут отключиться, данные – потеряться, а бизнес – понести миллионные убытки. По оценкам экспертов, каждая минута простоя крупного дата-центра обходится компаниям в тысячи долларов. Как же удаётся ЦОДам поддерживать бесперебойную работу даже во время тотального блэкаута? Секрет – в продуманной системе резервного питания.

Зачем дата-центру бесперебойное электропитание

ЦОД – сердце IT-инфраструктуры компании. Здесь хранятся данные, работают сайты, сервисы, облачные платформы. Остановка питания означает остановку всех этих сервисов. В условиях цифровой экономики даже небольшое прерывание работы может привести к серьёзным последствиям: от недовольства пользователей до финансовых потерь и проблем с репутацией. Поэтому надёжное резервное электроснабжение – обязательное условие для любого профессионального дата-центра.

Электросеть, питающая ЦОД, теоретически может отключиться по множеству причин: авария на подстанции, природные катаклизмы, плановые работы энергокомпаний или даже банальный человеческий фактор. ЦОДы должны быть готовы ко всему. Более того, существуют стандарты надёжности (так называемые Tier I-IV), определяющие допустимое время простоя в год. Например, дата-центр высшего уровня Tier IV допускает не более 26 минут отключения в год – то есть питание должно быть практически идеальным. Добиться этого можно только применяя специальное оборудование и схемы резервирования.

Ключевые элементы системы резервного питания в ЦОД:

  • Источники бесперебойного питания (ИБП) – аккумуляторные системы, мгновенно берущие нагрузку при сбое;
  • Дизель-генераторы (ДГУ) – мощные резервные электростанции, обеспечивающие долгосрочное питание;
  • Автоматика ввода резерва (АВР) – умная система переключения, которая связывает воедино основную сеть и резерв;
  • Резервированные схемы подключения – дублирующие линии и оборудование для устранения единой точки отказа;
  • Системы мониторинга и управления – программно-аппаратные комплексы, следящие за здоровьем всей энергосистемы.

Давайте разберём подробно, как работает каждый из этих компонентов и как вместе они позволяют дата-центру не заметить даже глобальное отключение электроэнергии.

Источники бесперебойного питания (ИБП)

ИБП – это первая линия обороны ЦОД при сбое питания. По сути, ИБП представляет собой высокомощный электрический аккумулятор с умной электроникой. Он постоянно подключён между городской сетью и серверным оборудованием. Пока внешнее электроснабжение в норме, ИБП заряжает свои батареи и одновременно фильтрует напряжение, защищая технику от всплесков и помех. Но стоит пропасть напряжению с основной сети – и ИБП за считанные миллисекунды берёт на себя питание нагрузки.

Важно отметить, что современные ИБП для дата-центров используют технологию двойного преобразования (online). Это значит, что переменное напряжение из сети сначала преобразуется в постоянное, а затем обратно в переменное требуемых параметров. Такая схема позволяет избежать даже кратковременных провалов напряжения – на выходе ИБП всегда остаётся стабильное питание. Оборудование даже не «понимает», что произошла авария: переключения нет вовсе или оно занимает доли секунды. Для сравнения: серверная электроника обычно начинает сбоить, если пауза в питании превышает 20 миллисекунд (0,02 секунды). ИБП не допускает даже таких микропауз.

Время автономной работы. Насколько же хватает ИБП, если электричество полностью исчезло? Всё зависит от ёмкости батарей и нагрузки. Типичный ИБП может поддерживать работу серверов в течение 5–15 минут без внешней подпитки. Казалось бы, немного. Но, как правило, этого достаточно, ведь ИБП – именно бесперебойный источник, предназначенный перекрыть промежуток до запуска более мощных резервов. Впрочем, батарейные модули можно наращивать: в некоторых ЦОДах ИБП рассчитаны и на 30, и на 60 минут автономии. Это даёт дополнительный запас времени на реакцию персонала или автоматике.

Масштаб и резервирование. Для крупных дата-центров одиночного ИБП недостаточно. Здесь применяются целые системы ИБП, работающие параллельно. Например, нагрузку 1 МВт могут обеспечивать сразу несколько модулей ИБП, объединённых в единую схему. Причём обычно реализуется резервирование N+1: если нужно четыре ИБП для питания всех серверов, устанавливают пятый – резервный. Тогда выход из строя одного источника не приведёт к отключению, его работу моментально возьмут на себя остальные. В ЦОД высших категорий надёжности практикуется даже дублирование 2N, когда вся система ИБП продублирована полностью.

Пример реального решения: компания IEK Group (бренд ITK) выпускает линейку мощных ИБП, специально предназначенных для серверных и малых ЦОД. Например, есть модели онлайн-ИБП на 10 кВА, встроенные в микромодульные дата-центры IEK. Такие устройства обладают всеми необходимыми функциями: фильтрация напряжения, мгновенное переключение на батареи, работа в параллельных модулях и удобный мониторинг состояния. Многие современные ИБП (включая решения IEK) оснащаются сетевым интерфейсом – SNMP-картой, позволяющей удалённо контролировать заряд батарей, нагрузку, температуру и получать аварийные оповещения. Это крайне важно для своевременного обслуживания: например, через 3-5 лет эксплуатации аккумуляторы ИБП требуют замены, и система заранее сигнализирует о снижении ёмкости батарей.

Подводя итог, ИБП берет на себя роль «страховочной сетки» – как только гаснет внешнее электричество, он тут же держит работу ЦОДа на своих батареях. Однако запас энергии в батареях ограничен. Что делать, если света нет дольше нескольких минут? Здесь на сцену выходят тяжелые резервы – дизельные генераторы.

Дизель-генераторы – резервные электростанции

Представьте небольшой частный дом с бензиновым генератором: при отключении света хозяин заводит мотор – и дом снова с электричеством. В дата-центре принцип тот же, но масштабы несравнимо больше и всё происходит автоматически. Дизель-генераторная установка (ДГУ) – это автономная электростанция, обычно состоящая из дизельного двигателя внутреннего сгорания, соединённого с мощным электрическим генератором. В крупных ЦОД таких установок может быть несколько, и каждая способна обеспечить сотни киловатт или даже мегаватты мощности.

Когда внешнее электроснабжение пропадает, система автоматически запускает ДГУ. Происходит это по сигналу от ИБП или от системы мониторинга: как только зафиксировано аварийное падение напряжения, посылается команда на старт. Дизельному мотору требуется некоторое время, чтобы выйти на рабочий режим – обычно от нескольких секунд до пары минут в зависимости от модели и нагрузки. Чаще всего за ~10–30 секунд генератор уже готов отдавать значительную мощность, а полную стабильность набирает в пределах 1–3 минут. Всё это время ЦОД питается от ИБП. Как только ДГУ раскрутился и вышел на нужные обороты, он берёт на себя снабжение дата-центра энергией.

Как долго может работать генератор? Теоретически – сколько угодно, пока есть топливо. В бак ДГУ заливается дизельное топливо, и при работе двигатель потребляет его литрами в час. В практике дата-центров на объекте обычно хранится запас солярки минимум на 8–12 часов непрерывной генерации. Многие компании страхуются и держат резерв на 24–48 часов автономной работы, а также имеют договорённости с поставщиками топлива на экстренную дозаправку. Это значит, что даже если город останется без света несколько суток подряд, хорошо подготовленный ЦОД продолжит работать, урча своими генераторами в машинном зале или на крыше здания.

Резервирование и тесты. Как и ИБП, генераторы в важных центрах тоже резервируются. Обычно устанавливается как минимум один лишний ДГУ сверх расчётной потребности – на случай, если какой-то не запустится. Например, для нагрузки 2 МВт можно поставить три дизель-генератора по 1 МВт: в рабочем режиме два справляются с питанием, а третий ждёт на случай ЧП. Запуск ДГУ происходит автоматически, но тем не менее требует регулярного контроля. Поэтому в рамках эксплуатации ЦОД генераторы еженедельно или ежемесячно проверяют: проводят тестовые пуски, иногда под нагрузкой, меняют масло и фильтры по регламенту. Все эти меры нужны, чтобы в момент настоящей аварии двигатель не подвёл – ведь он может простаивать без дела месяцами, но обязан заработать с пол-оборота, когда случится беда.

Стоит добавить, что в последнее время для резервного питания некоторых объектов стали применять альтернативы дизелю – газовые турбины, водородные топливные элементы, крупные литий-ионные батареи. Однако подавляющее большинство дата-центров по-прежнему полагается на проверенные временем дизель-генераторы из-за их надёжности и относительной простоты.

Итак, мы выяснили: ИБП мгновенно берёт нагрузку на себя, а затем в течение нескольких секунд стартует дизель-генератор, готовый долго снабжать ЦОД энергией. Но как все эти устройства «договариваются» между собой, кто и когда передаёт эстафету питания? За это отвечает следующий компонент – автоматика ввода резерва.

Автоматика ввода резерва (АВР)

Автоматический ввод резерва (АВР) – мозг и переключатель системы резервного электропитания. Его задача – незаметно для оборудования перекинуть источник питания с одного на другой, когда это необходимо. Проще говоря, АВР – это электрический щит (шкаф) с набором датчиков, контроллеров и силовых переключателей (контакторов или автоматических выключателей). Он постоянно мониторит напряжение на основном вводе (городской электросети) и на резервном вводе (со стороны генератора).

Как только основное напряжение пропадает или выходит за допустимые пределы – АВР отключает основную линию и подключает резервную. В связке с ним работает система управления ДГУ: АВР же даёт команду на запуск двигателя при необходимости. При возврате городской энергии всё происходит в обратном порядке – но не мгновенно, а когда сеть стабилизировалась. Обычно АВР заложены задержки в несколько секунд или минут, чтобы исключить ложные срабатывания (например, если в сети короткое моргание). Только убедившись, что основное питание восстановилось надёжно, автоматика переключит ЦОД обратно на него и заглушит генераторы.

Типы переключателей. С технической точки зрения, АВР может быть реализован на разных элементах. В традиционном варианте это блок электромеханических контакторов или автоматических выключателей, управляемых реле или электронным контроллером. Такие устройства срабатывают за десятки или сотни миллисекунд – этого вполне достаточно на уровне ввода, ведь генератор всё равно требует время раскрутки (ИБП удержит нагрузку). В продвинутых системах используются статические переключатели (STS) на базе электроники (симисторы, тиристоры). Они способны перевести питание на другую линию за 4–8 миллисекунд, практически мгновенно. STS применяются чаще на уровне отдельных стоек или устройств, где требуется минимизировать даже кратчайшие перебои, но на уровне целого ЦОД обычно достаточно классического АВР с механическим приводом.

Решения на практике: для небольших серверных или филиальных ЦОД существуют компактные модульные АВР. Например, выпускаются готовые устройства автоматического ввода резерва IEK на ток 63 А, которые легко устанавливаются в электрощит и способны переключать питание трёхфазной сети на резервный ввод. Такие блоки имеют ряд встроенных защит – от перегрузки, от короткого замыкания, – и потребляют всего несколько ватт в дежурном режиме. В больших дата-центрах АВР – это уже целый шкаф, часть главного распределительного щита (ГРЩ). Он управляет мощными вводными автоматами, от которых питаются все залы ЦОД, и может коммутировать токи в сотни и тысячи ампер. Но принцип тот же: автоматика чётко отслеживает качество электросети и при аварии мгновенно цепляет “второй провод” от генератора.

Кроме главного АВР на вводе здания, резервные переключатели могут стоять и дальше по цепочке. Например, на уровне отдельных серверных стоек используются АВР-пилоты (их ещё называют реклоузеры в стойке). Зачем они нужны? Дело в том, что в серьёзных ЦОДах до каждой стойки серверов часто доведено сразу две независимых линии электропитания (так называемые ввод А и ввод B), каждая со своей цепочкой ИБП и генераторов. Серверы и сетевое оборудование обычно имеют по два блока питания и подключаются сразу к двум PDU (силовым распределителям) – на случай, если один ввод пропадёт, устройство питается от второго. Но если какое-то устройство вдруг оснащено лишь одним блоком питания, его защищает небольшой АВР в стойке: он почувствует, если один кабель обесточен, и переключит питание этого сервера на резервный кабель. Таким образом даже на самом нижнем уровне устраняется «единственная точка отказа».

Разумеется, администраторы стараются избегать техники с одним питанием, чтобы не усложнять систему. Однако пример показывает масштаб подхода к резервированию: вплоть до каждого сервера питание дублируется или автоматически переключается, чтобы сбой на любой одной линии не сказался на работе всего ЦОД.

Как устроена схема резервного электропитания ЦОД

Соберём всё вместе. Типовой современный дата-центр имеет многоуровневую систему электроснабжения, где на каждом уровне есть резерв. Упрощённо работу этой системы можно описать так:

  1. Штатный режим: оборудование ЦОД питается от городской электросети через мощные ИБП. ИБП выравнивают напряжение и незаметно подзаряжают свои батареи. Дизель-генераторы находятся в режиме ожидания.
  2. Авария в сети: происходит отключение внешнего электропитания. ИБП мгновенно (0 мс – несколько мс) переключается на питание серверов от своих батарей. Для серверов и другой техники ничего не меняется – напряжение остаётся стабильным.
  3. Запуск генераторов: спустя секунды автоматика даёт команду на старт дизель-генераторов. Через 10–20 секунд первые из них выходят на режим и начинают подавать напряжение на резервный ввод.
  4. Переключение АВР на резерв: АВР обнаруживает, что питание от ДГУ стало качественным, и переключает нагрузку ЦОД с батарей ИБП на работающие генераторы. Теперь все серверы получают энергию от дизель-генераторов (через те же ИБП, которые могут работать в режиме байпаса либо продолжать сглаживать ток).
  5. Длительная работа от резерва: если городское электроснабжение не восстанавливается долго, генераторы могут работать часами и днями. ИБП при этом могут снова начать подзарядку батарей от генераторного тока, чтобы восстановить резерв к началу следующего цикла.
  6. Возврат на основную сеть: как только приходит внешнее напряжение и стабилизируется, система (вручную или автоматически) переводит ЦОД обратно на питание от городской сети. АВР переключает ввод на магистраль, генераторы отключаются, но остаются в режиме горячей готовности на случай нового сбоя. ИБП возобновляют штатный режим работы (подзаряд батарей, онлайн-фильтрация напряжения).

Эта схема реализует принцип «No Single Point of Failure» – отсутствие единой точки отказа. Каждый компонент дублирован или имеет альтернативу: две независимые линии ввода, множественные ИБП, несколько генераторов, резервные переключатели. Даже если выйдет из строя один элемент цепочки, резерв тут же его заменит. Такая архитектура даёт устойчивость к самым разным ситуациям – от коротких морганий до масштабных аварий.

Конечно, полное резервирование – удовольствие не из дешёвых: дополнительное оборудование, батареи, горючее, обслуживание и тестирование – всё это серьёзные вложения. Но альтернативы нет: для объектов, где ценность непрерывной работы превышает затраты на инфраструктуру, резервное питание – спасательный круг, который просто обязан сработать вовремя.

Системы мониторинга и управления

Нельзя забывать ещё об одном важном аспекте: просто установить ИБП и генераторы мало, ими нужно грамотно управлять и контролировать их состояние. В современных ЦОДах используются комплексные системы мониторинга энергоснабжения. Специальные программно-аппаратные комплексы собирают информация со всех узлов: параметры напряжения и тока, уровень заряда батарей, температура компонентов, наличие топлива в резервуарах, давление масла в двигателях – десятки параметров.

Вся эта телеметрия сходится в диспетчерский центр (или на пульт дежурного инженера). Если что-то начинает выходить за пределы нормы – система сигнализирует. Например, при деградации батарей ИБП заранее сообщит, что ёмкость упала до критического уровня – и обслуживающая команда успеет заменить аккумуляторы планово, не дожидаясь аварии. Или, скажем, датчики топлива могут предупредить, что запас солярки снизился ниже 50% – повод дозаправить бак заблаговременно.

Мониторинг также позволяет оптимизировать работу: автоматически запускать тесты генераторов в часы минимальной нагрузки, следить за равномерностью распределения нагрузки между вводами, выявлять потенциально перегруженные цепи. Интегрированные решения от крупных производителей (например, та же платформа MasterSCADA, входящая в группу IEK, или зарубежные аналоги) дают возможность наблюдать всю картину энергоснабжения центра обработки данных через единый интерфейс. Оператор видит на экране схему, где зелёным горит активная линия, сразу заметит, если что-то переключилось на резерв, и сможет оперативно вмешаться при необходимости.

В целом задача мониторинга – предотвратить сбой до его возникновения. Резервные источники питания сами по себе не гарантируют 100% надёжности, если за ними не следить. Поэтому умная начинка и постоянный контроль – неотъемлемая часть инфраструктуры питания ЦОД, наряду с «железом».

Заключение: энергия без права на перебой

Надёжное резервное электропитание – это то, что обычно остаётся за кадром, когда мы пользуемся интернет-сервисами, храним файлы в облаке или совершаем банковские операции онлайн. Мы даже не задумываемся, сколько инженерных решений стоит за тем, чтобы привычные приложения работали 24/7. ИБП, дизель-генераторы, автоматика, сложные схемы – всё это, по сути, страховочная сетка, которая не даёт цифровому миру оборваться, когда гаснет свет в мире физическом.

Для широкой публики система резервного питания в ЦОД может казаться чем-то сложным. Но надеемся, что эта статья показала основные принципы её работы понятным языком. Технологии, конечно, не стоят на месте: будущее обещает более экологичные источники резервной энергии, новые накопители, интеллектуальные сети. Однако фундаментальная задача остаётся прежней – обеспечить бесперебойную работу ключевых сервисов, чего бы это ни стоило.

А что вы думаете о таких системах? Приходилось ли вам сталкиваться с неожиданными отключениями электричества и последствиями? Как бы вы чувствовали себя, зная, что за работой вашего любимого сайта денно и нощно следит гудящий в подвале генератор? Поделитесь своим мнением в комментариях! Возможно, у вас есть свой опыт организации резервного питания – будет интересно обсудить.

Похожие статьи