Plan Szkolenia

Wprowadzenie do AIOps

  • Co to jest AIOps i dlaczego jest ważne
  • Tradycyjne monitorowanie vs. obserwowalność napędzana przez AIOps
  • Architektura AIOps i kluczowe komponenty

Zbieranie i normalizowanie danych operacyjnych

  • Rodzaje danych obserwowalności: metryki, logi i ślady
  • Pobieranie danych z wielu źródeł (serwerów, kontenerów, chmury)
  • Używanie agentów i eksportowników (Prometheus, Beats, Fluentd)

Korelacja danych i wykrywanie anomalii

  • Korelacja szeregów czasowych i metody statystyczne
  • Używanie modeli ML do wykrywania anomalii
  • Wykrywanie incydentów w rozproszonych systemach

Alertowanie i redukcja szumu

  • Projektowanie inteligentnych reguł i progowych alertów
  • Tłumienie, deduplikacja i grupowanie alertów
  • Integracja z Alertmanager, Slack, PagerDuty lub Opsgenie

Analiza przyczyn i wizualizacja

  • Używanie panele do wizualizacji metryk i wykrywania trendów
  • Badanie wydarzeń i lini czasowych dla RCA
  • Śledzenie problemów w różnych warstwach za pomocą narzędzi do rozproszonego śledzenia

Automatyzacja i naprawa

  • Wykonywanie automatycznych skryptów lub przepływów pracy z incydentów
  • Integracja z systemami ITSM (ServiceNow, Jira)
  • Przypadki użycia: samonaprawianie, skalowanie, przekierowywanie ruchu

Platformy AIOps open source i komercyjne

  • Przegląd narzędzi: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kryteria oceny dla wyboru platformy AIOps
  • Demonstracja i praktyka z wybranym zestawem

Podsumowanie i następne kroki

Wymagania

  • Zrozumienie koncepcji operacji IT i monitorowania systemów
  • Doświadczenie w narzędziach lub panelach monitorowania
  • Zapoznanie się z podstawowymi formatami logów i metryk

Grupa docelowa

  • Zespoły operacyjne odpowiedzialne za infrastrukturę i aplikacje
  • Inżynierowie niezawodności systemów (SREs)
  • Zespoły monitorowania IT i obserwowalności
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie