Рейтинг@Mail.ru

Система мониторинга ИТ-служб

Для компании, бизнес которой существенно зависит от бесперебойной работы информационной системы, жизненно важным является непрерывный мониторинг её ключевых параметров. В случае возникновения неисправности, или при приближении параметров к критическим значениям мониторинг позволяет оперативно принять меры и, таким образом, предотвратить (сократить) простой в её работе, который напрямую связан с финансовыми потерями. Действительно, отказ кондиционера в серверной комнате чреват перегревом оборудования, выходом из строя жестких дисков, потерей данных и работоспособности бизнеса. Генеральный Директор не будет в восторге, если ему не удастся получить важное письмо только потому, что место на диске сервере 'внезапно закончилось'. Своевременное обнаружение подобных ситуаций и есть задача средств мониторинга.

Один из клиентов ООО 'Нетамс' поставил задачу внедрения мониторинга всего, что только возможно, в своей информационной и телекоммуникационной системе. Помимо этого, необходимо было решить задачу контроля объема сетевого трафика в локальной сети.

Для задач мониторинга телекоммуникационных систем достаточно давно был разработан, и успешно применяется, протокол SNMP, и использующие его программные решения. Для целей мониторинга приложений также существует ряд продуктов. Специфика задачи состояла в том, что большинство аппаратных устройств заказчика поддерживало SNMPv2, а мониторинг серверов (операционных систем) и приложений требовался в ограниченном объеме, но с поддержкой максимального числа платформ.

Наши специалисты выбрали, и успешно развернули систему мониторинга, основанную на:

  • Бесплатном программном обеспечении Zabbix 1.8.4 с агентами:
    • SNMP
    • Встроенными для операционных систем Windows и Linux
    • ping
  • Системе мониторинга окружающей среды APC AP9320
  • Собственной разработке NeTAMS 3.4 для сбора статистики с Ethernet-интерфейсов коммутаторов по SNMP

Система мониторинга установлена в виртуальную машину VMware под управлением Debian Linux, используется база данных MySQL.

Таким образом, в единый центр мониторинга удалось свести информацию о доступности, состоянии следующих информационных систем заказчика:

  • Параметров работы операционных систем Linux, Windows, выполняемых в виртуальных машинах (загрузка процессора и памяти, наличие места на дисках, трафик через сетевые интерфейсы, доступность ключевых служб: почты, веб, DNS, …)
  • Параметров работы физических серверов, обслуживающих виртуальные машины (загрузка процессора и памяти, наличие места на дисках, температура системы)
  • Параметров работы системы хранения данных (загрузка, наличие сбойных дисков)
  • Параметров функционирования сетевого оборудования (коммутаторы и маршрутизаторы: доступность, загрузка; беспроводное оборудование: количество беспроводных клиентов)
  • Состояние источников бесперебойного питания (напряжение и ток на входе и выходе, нагрузка, состояние батарей, температура). При помощи внешних датчиков, подключенных к ИБП, также контролируется температура и влажность в серверных помещениях, и ряде других объектов.
  • При помощи автономной системы мониторинга АРС контролируется наличие дыма, протечек, вибрации, открытие дверей в серверных помещениях, и прочие параметры безопасности.

По результатам установки контролируется порядка 70 хостов, 1500 параметров и 500 триггеров.

В случае срабатывания триггера (например, превышение загрузки процессора некоторого порогового значения, повышения температуры, пропадания связи с каким-то элементом инфраструктуры) администраторы получают уведомления по электронной почте и SMS, дабы оперативно проанализировать ситуацию и принять требуемые меры.

Программное обеспечение NeTAMS 3.4 разработки ООО «Нетамс» позволило собирать статистику по загрузке каждого из Ethernet-портов коммутаторов ядра и доступа с целью оперативного реагирования в случае возникновения нештатных ситуаций.

Таким образом при минимальных затратах (бесплатное ПО) заказчик получил надежный и гибкий инструмент контроля за состоянием собственной телекоммуникационной инфраструктуры, и может с уверенностью опираться на неё в своем бизнесе.

Проекты