Интегрированный инструмент мониторинга состояния серверов и окружающей среды

Новости
furlong-facebook-servers

Обычно это две системы наблюдения: за условиями окружающей среды (внутри и снаружи дата-центра) и за состоянием серверов. Компания Facebook смогла создать интегрированный инструмент наблюдения, объединяющий эти две системы. Работа над ней началась после того, как у произошла аварийная ситуация: уровень загруженности процессоров многих серверов внезапно достиг «потолка», то есть 100%, и социальная сеть компании стала недоступной для многих пользователей. Из строя вышло около 300 серверных стоек, что, конечно же, не могло не повлиять на работу ресурса.


Сразу же после этого перед инженерами компании поставили задачу обдумать возможность интеграции двух систем наблюдения: за условиями снаружи и внутри здания (стороннее ПО) и за серверами («родное» приложение от Facebook). Объединенная система «принимает во внимание» внешние данные, например, температура окружающей среды, влажность, уровень энергопотребления, а также внутренние, вроде загруженности CPU, загруженности памяти и хранилищ данных.

За прошедшие несколько месяцев корпорация представила новую инфраструктуру управления дата-центром (Data Center Infrastructure Management), а также новую кластерную систему для визуализации всех полученных данных. В этом году планируется более широкое внедрение новой разработки.

Новая система позволит снизить количество обслуживающего персонала, а также распределить оборудование, что позволит улучшить общую производительность. По мнению разработчиков, новинка поможет выполнять работу по визуализации данных за считанные минуты (30 минут вместо 12 часов, по данным авторов проекта).

Кроме того, данная система поможет использовать сервера наиболее эффективно, позволяя максимально долго откладывать момент создания нового дата-центра.

Более подробно о новой системе будет доложено на Open Compute Summit, в январе. Пока что неясно, будет ли проект открыт для общественности, с возможностью получения примера системы, или же это будет закрытый проект для внутреннего использования в дата-центрах Facebook. Тем не менее, идея, заложенная инженерами Facebook в свой продукт, сможет послужить и сторонним разработчикам, для создания похожих систем.

Интегрированный инструмент мониторинга состояния серверов и окружающей среды by

Возможно, вас также заинтересует:

При копировании материалов ссылка обязательна.