Система мониторинга ИТ-служб
Для компании, бизнес которой существенно зависит от бесперебойной работы информационной системы, жизненно важным является непрерывный мониторинг её ключевых параметров. В случае возникновения неисправности, или при приближении параметров к критическим значениям мониторинг позволяет оперативно принять меры и, таким образом, предотвратить (сократить) простой в её работе, который напрямую связан с финансовыми потерями. Действительно, отказ кондиционера в серверной комнате чреват перегревом оборудования, выходом из строя жестких дисков, потерей данных и работоспособности бизнеса. Генеральный Директор не будет в восторге, если ему не удастся получить важное письмо только потому, что место на диске сервере 'внезапно закончилось'. Своевременное обнаружение подобных ситуаций и есть задача средств мониторинга.
Один из клиентов ООО 'Нетамс' поставил задачу внедрения мониторинга всего, что только возможно, в своей информационной и телекоммуникационной системе. Помимо этого, необходимо было решить задачу контроля объема сетевого трафика в локальной сети.
Для задач мониторинга телекоммуникационных систем достаточно давно был разработан, и успешно применяется, протокол SNMP, и использующие его программные решения. Для целей мониторинга приложений также существует ряд продуктов. Специфика задачи состояла в том, что большинство аппаратных устройств заказчика поддерживало SNMPv2, а мониторинг серверов (операционных систем) и приложений требовался в ограниченном объеме, но с поддержкой максимального числа платформ.
Наши специалисты выбрали, и успешно развернули систему мониторинга, основанную на:
- Бесплатном программном обеспечении Zabbix 1.8.4 с агентами:
- SNMP
- Встроенными для операционных систем Windows и Linux
- ping
- Системе мониторинга окружающей среды APC AP9320
- Собственной разработке NeTAMS 3.4 для сбора статистики с Ethernet-интерфейсов коммутаторов по SNMP
Система мониторинга установлена в виртуальную машину VMware под управлением Debian Linux, используется база данных MySQL.
Таким образом, в единый центр мониторинга удалось свести информацию о доступности, состоянии следующих информационных систем заказчика:
- Параметров работы операционных систем Linux, Windows, выполняемых в виртуальных машинах (загрузка процессора и памяти, наличие места на дисках, трафик через сетевые интерфейсы, доступность ключевых служб: почты, веб, DNS, …)
- Параметров работы физических серверов, обслуживающих виртуальные машины (загрузка процессора и памяти, наличие места на дисках, температура системы)
- Параметров работы системы хранения данных (загрузка, наличие сбойных дисков)
- Параметров функционирования сетевого оборудования (коммутаторы и маршрутизаторы: доступность, загрузка; беспроводное оборудование: количество беспроводных клиентов)
- Состояние источников бесперебойного питания (напряжение и ток на входе и выходе, нагрузка, состояние батарей, температура). При помощи внешних датчиков, подключенных к ИБП, также контролируется температура и влажность в серверных помещениях, и ряде других объектов.
- При помощи автономной системы мониторинга АРС контролируется наличие дыма, протечек, вибрации, открытие дверей в серверных помещениях, и прочие параметры безопасности.
По результатам установки контролируется порядка 70 хостов, 1500 параметров и 500 триггеров.

В случае срабатывания триггера (например, превышение загрузки процессора некоторого порогового значения, повышения температуры, пропадания связи с каким-то элементом инфраструктуры) администраторы получают уведомления по электронной почте и SMS, дабы оперативно проанализировать ситуацию и принять требуемые меры.

Программное обеспечение NeTAMS 3.4 разработки ООО «Нетамс» позволило собирать статистику по загрузке каждого из Ethernet-портов коммутаторов ядра и доступа с целью оперативного реагирования в случае возникновения нештатных ситуаций.

Таким образом при минимальных затратах (бесплатное ПО) заказчик получил надежный и гибкий инструмент контроля за состоянием собственной телекоммуникационной инфраструктуры, и может с уверенностью опираться на неё в своем бизнесе.
Проекты
- Построение сетевой и серверной инфраструктуры здания
- Корпоративная локальная беспроводная сеть (WiFi)
- Аудит IT-инфраструктуры сети интернет-магазинов
- Учет трафика в небольшом офисе
- Система мониторинга ИТ-служб
- Объединение офисов (VPN)
- Служба каталога и система электронной почты (Windows)
- Организация узла доступа для небольшого интернет-провайдера
- Реорганизация растущей экосистемы нагруженных вебсайтов
- Виртуализация вычислительных ресурсов и СХД