План на курса

Въведение в разширеното предупреждение

  • Основни принципи на предупреждение в ИТ системите
  • Преглед на Prometheus Alertmanager
  • Възможности за предупреждение в Grafana

Създаване на разширени правила за предупреждение

  • Определяне на правила за предупреждение в Prometheus
  • Използване на етикети и анотации за предупреждения
  • Групиране и стратегии за заглушаване

Интегриране на Alertmanager с външни системи

  • Конфигуриране на уеб кукички за външни интеграции
  • Интегриране с инструменти като Slack, PagerDuty и системи за електронна поща
  • Персонализиране на шаблони на Alertmanager

Автоматизиране на отговорите на предупреждения

  • Внедряване на автоматизирани работни процеси за коригиране
  • Интегриране с инструменти за оркестрация (напр. Ansible, Kubernetes)
  • Използване на скриптове за автоматизирано разрешаване на проблеми

Визуализиране на сигнали в Grafana

  • Настройване на панели за предупреждения в Grafana
  • Персонализиране на предупредителни известия и прагове
  • Най-добри практики за наблюдение на състоянието на предупреждение

Управление на предупреждения с голям обем

  • Ефективно справяне с предупредителни бури
  • Оптимизиране Prometheus на производителността за предупреждение
  • Scalaсъображения за възможностите за Alertmanager

Мащабиране и усъвършенствани техники

  • Разпределени настройки за предупреждение с Prometheus и Alertmanager
  • Интегриране с базирани на облак решения за предупреждение
  • Проучване на нови функции в Grafana и Prometheus екосистеми

Обобщение и следващи стъпки

Изисквания

  • Основен опит с Grafana и Prometheus
  • Разбиране на концепциите за ИТ мониторинг
  • Познаване на скриптове или програмиране за автоматизация

Публика

  • DevOps инженери
  • Инженери за надеждност на сайта (SRE)
 14 Часа

Брой участници


Цена за участник

Oтзиви от потребители (2)

Предстоящи Курсове

Свързани Kатегории