В дефолтной поставке системы Сacti есть шаблон для мониторинга состояния процессора unix систем. Визуально график выглядит так:
Красиво, но мало информативно. Логичный вопрос, что не так? На самом деле, у сервера 2 ядра (процессора) и система согласно выполняемым задачам, в текущем состоянии особо не нагружена, есть небольшая дисковая нагрузка в пределах нормы, но из данного графика все это понять просто не возможно.
В свое время мои «кактусы» прошли обновление на более правильный шаблон — «ucdnet — full_cpu_usage» .
В Интернете можно найти две реализации данного шаблона.
Первый, примерно то же самое, что и стандартный, но содержит больше данных: «Kernel», «Wait» и т.д., ниже он представлен как «1 ucd/net — Full CPU Usage».
Второй – «2 ucd/net — Full CPU Usage» как раз тот, что использую я.
На тестовом стенде, графики выглядят так:
На продакшен системах это выглядит так:
Если сделать краткий анализ, то видно, что в воскресенье в районе 00:00 часов на сервере была дисковая перегрузка (область черного цвета — IOWait), которая не повлияла на общее состояние сервера.
На длительное превышение «IOWait» желательно поставить трешходл, срабатывание которого, даст системному администратору дополнительный повод проверить состояние жестких дисков.
Шаблоны для скачивания:
2 ucd/net — Full CPU Usage (шаблон который использую я)
1 ucd/net — Full CPU Usage (расширенный вариант шаблона CPU Usage )