Все технические вопросы в центрах обработки данных можно решить с помощью технологий Saia® PCD. Самым большим препятствием на этом пути является недостаток информации. Надеемся, что предлагаемая статья хотя бы частично его восполнит.
«Сайа Бургесс Контролз Рус», г. Москва
Создание систем кондиционирования, вентиляции и обогрева (HVAC) в центрах обработки данных (ЦОД) представляет собой довольно трудную задачу. Эти системы должны отвечать многим условиям – быть надежными, резервированными, отказоустойчивыми, соответствовать требованиям конкретного уровня и проч. При этом они весьма изменчивы. Некоторые специалисты пытаются решить вопросы технической безопасности с помощью отказоустойчивой сети. В конце статьи вам останется только удивляться, почему такой подход до сих пор не нашел широкого применения. В его основу положено простое, но важное правило.
Ссылка на видеоролик о продукции компании Saia Burgess
Классификация ЦОД
Известны четыре категории центров обработки данных (уровни I–IV). Первый уровень – низший и не подразумевает ничего, кроме «обычной» серверной комнаты в здании, тогда как ЦОД четвертого, высшего уровня должен отвечать самым строгим требованиям по обслуживанию и отказоустойчивости. Критерии этой классификации определены в стандарте Data Center Site Infrastructure Tier Standard: Operational Sustainability, разработанном центром сертификации Uptime Institute («Институт бесперебойных процессов»), который был учрежден в 1993 году в городе Санта-Фе (США). Эта организация играет ключевую роль в совершенствовании безотказной работы ЦОД.
Четырехуровневая классификация ЦОД: топология
Стандарт «Tier Standard: Topology» определяет инфраструктуру ЦОД с помощью четырехуровневой классификации, причем работоспособность всех систем обязательно проверяется на соответствие заявленным техническим условиям. Подчеркнем, что эта система классификации описывает именно топологию сетевого узла, то есть инфраструктуру, обеспечивающую работу центра обработки данных, а не характеристики отдельных систем или подсистем.
Ниже кратко охарактеризован каждый уровень стандарта.
Уровень I – базовый. Для технического обслуживания и текущего ремонта требуется отключение всего объекта. На работу ЦОД может негативно повлиять недостаток мощности и отказы в системе электропитания и охлаждения.
Уровень II – с резервированием отдельных систем. Для технического обслуживания и текущего ремонта по-прежнему требуется отключение всего объекта. На работе ЦОД этого уровня также может отрицательно сказаться нехватка мощности и отказы в системе электропитания и охлаждения. Однако время простоя сокращено благодаря введению одной резервной единицы оборудования в каждой системе.
Уровень III – с гарантированной возможностью параллельного проведения ремонтных работ. Абсолютно любой компонент системы может быть выведен из эксплуатации на плановой основе без влияния на процесс обработки данных. Однако ЦОД этого уровня все еще подвержен опасности внеплановых остановок, которые могут произойти из-за отказа оборудования или операторских ошибок.
Уровень IV – отказоустойчивый, повышенной надежности. Благодаря наличию резервных путей электропитания и охлаждения отказы отдельных узлов или сбои в системах электропитания и охлаждения не влияют на работу центра. В ЦОД этого уровня также обеспечена возможность параллельного проведения ремонтных работ.
Критерии этой классификации достаточно сложны и включают в себя требования не только к оборудованию, но и к зданию, и к обслуживающему персоналу. Например, в ЦОД третьего уровня должны дежурить техники по обслуживанию и ремонту 24 часа в сутки 7 дней в неделю. В ЦОД второго уровня должна быть обеспечена техническая поддержка производителя или поддержка по вызову пять дней в неделю в течение рабочей смены. А в центрах первого уровня персоналу разрешено пить кофе и пользоваться микроволновками.
Таблица. Классификация ЦОД согласно многоуровневой концепции¹
*Эта таблица представляет собой выдержку из четырехуровневой классификации,
и она неполная. Таблица взята с сайта «Uptime Institute».
Требования к системе HVAC
Четырехуровневая классификация определяет степень работоспособности ЦОД. Однако в этой классификации не указано, как должна быть спроектирована и реализована HVAC-система. Ясно одно: работоспособность ЦОД повышается с 99,671 % (уровень I) до 99,991 % (уровень IV) благодаря тому, что от уровня к уровню растет избыточность инфраструктуры. По этой причине необходимо, чтобы автоматизированные станции не только соответствовали стандарту IEC61131-2 в отношении ПЛК, но и отвечали дополнительным требованиям, предъявляемым, например, в области судостроения. Благодаря этому будут соблюдены условия, необходимые для уровней III и IV.
Реализация системы
Хотя ни рассматриваемая спецификация, ни немецкая отраслевая ассоциация BITKOM (Федеральная сеть информационных технологий и коммуникаций) не конкретизируют понятий избыточности, отказоустойчивости и т. д. в отношении HVAC-систем, практика показала, что начиная со второго уровня необходимо обеспечить резервирование центрального процессора (ПЛК), а начиная с уровня III – избыточность уровня I/O и остальных подсистем инфраструктуры шкафов. По сути, начиная с третьего уровня требование к резервированию означает необходимость установки двух одинаковых шкафов управления. Контроллеры PCD в этих двух шкафах должны быть оснащены одинаковой программой и синхронизированы для обмена данными. При выходе из строя одного шкафа управления или при проведении плановых работ его функции передаются второму шкафу.
Таким образом, согласно этим принципам и спроектирован ЦОД Европейской организации спутниковой метеорологии (EUMETSAT), который в настоящее время сооружает компания TOBOL Control GmbH. Необходимо также, чтобы сам по себе обмен данными отвечал принципу резервирования, что достигается с помощью интерфейсов Ethernet и RS‑485. В соответствии с требованиями к уровню II только центральные процессоры должны быть избыточными для работы с уровнем ввода/вывода. Это достигается путем соединения портов ввода/вывода с раздельными контроллерами PCD или Smart-RIO-PCD3.T6xx. Возможности свободного программирования и связи обеспечивают органичную интеграцию технологии автоматизации в ИТ-инфраструктуру вплоть до уровня I/O.
Дополнительные возможности ЦОД
Согласно отчету интерактивного специализированного журнала Data Center Knowledge, системы управления инфраструктурой центров обработки данных (так называемые «системы DCIM») – тема, вызывающая наибольший интерес у операторов крупных ЦОД².
Их усилия направлены на то, чтобы объединить в одно целое управление инженерными системами центра обработки данных и управление его ИТ-инфраструктурой и таким образом обеспечить наиболее эффективную эксплуатацию ЦОД. На практике это означает, что автоматизированная станция должна поддерживать целый ряд интерфейсов, шин и протоколов связи со всеми полевыми компонентами и модулями, данные которых обрабатываются и направляются в ИТ-системы. В конечном счете ИТ-специалисты стремятся обеспечить такую прозрачность, которая позволяла бы получать данные о состоянии каждого модуля, при этом они хотят как можно меньше работать с ICA. Чтобы выполнить эти пожелания, вам придется говорить с ними на их языке. Только упомянем широко распространенные протоколы SNMP или FTP, позволяющие использовать данные на уровне управления как читаемые Excel-файлы. Контроллеры PCD поддерживают эти протоколы по умолчанию.
Рис. Надежно функционирующий ЦОД³:
MVMD Medium-voltage main Distribution – распределительный щит средней мощности,
LVMD – низковольтный распределительный щит, CACU – циркуляционное воздушное охлаждение,
UPS – ИБП, STS – статический переключатель нагрузки, SD – распределительная часть щита
без главного выключателя и приборов, G – генератор
Энергосбережение – чрезвычайно важная проблема, и к центрам обработки данных она тоже имеет отношение: их популярность в мире неуклонно возрастает, а вместе с ней растет и количество потребляемой ЦОДами энергии. Контроллеры PCD, компактные устройства S‑Energy Manager, счетчики и интерфейсы связи позволяют получать, хранить и передавать данные о расходе электроэнергии. Таким образом определяются пиковые нагрузки или плохая стабилизация в сети, после чего принимаются соответствующие меры по устранению неисправностей.
Выводы
Центры обработки данных нуждаются в максимальном увеличении времени безотказной работы. Этим требованиям удовлетворяет технология Saia® PCD, которая в рамках соответствующего стандарта обеспечивает надежно функционирующее оборудование, возможность свободного программирования, поддержку ИТ-протоколов, учет и мониторинг энергопотребления. Однако в компании вам никогда не предложат «технологию множественного резервирования» или «отказоустойчивую технологию», потому что на работу всей системы влияют общие условия эксплуатации.
____________________________________________
¹Источник: http://www.bitkom.org/files/documents/BITKOM_Matrix_Ausfallzeit_RZ_V5_0.pdf. Ассоциация Federal Association for Information Technology, Telecommunications and New Media.
²Источник: http://www.inside-it.ch/articles/26554.
³Источник: http://www.bitkom.org/files/documents/BITKOM_Planungshilfe_Betriebsicheres_Rechenzentrum_2011.pdf. Ассоциация Federal Association for Information Technology, Telecommunications and New Media.
Статья опубликована в журнале «ИСУП», № 2(44)_2013
Костас Кафандарис (Kostas Kafandaris),
«Сайа Бургесс Контролз Рус», г. Москва,
тел.: (495) 744-0910,
e‑mail: info@saia-burgess.ru,