Plan Szkolenia

Wprowadzenie do AIOps

  • Co to jest AIOps i dlaczego ma znaczenie
  • Tradycyjne monitorowanie vs. obserwowalność napędzana przez AIOps
  • Architektura AIOps i kluczowe komponenty

Zbieranie i normalizowanie danych operacyjnych

  • Typy danych obserwowalności: metryki, logi i ślady
  • Importowanie danych z wielu źródeł (serwery, kontenery, chmura)
  • Używanie agentów i eksporterów (Prometheus, Beats, Fluentd)

Korelacja danych i wykrywanie anomalii

  • Korelacja szeregów czasowych i metody statystyczne
  • Używanie modeli ML do wykrywania anomalii
  • Wykrywanie incydentów w rozproszonych systemach

Alertowanie i redukcja szumu

  • Projektowanie inteligentnych zasad alertów i progi
  • Tłumienie, deduplikacja i grupowanie alertów
  • Integracja z Alertmanager, Slack, PagerDuty lub Opsgenie

Analiza przyczyn i wizualizacja

  • Używanie dashboardów do wizualizacji metryk i wykrywania trendów
  • Eksplorowanie zdarzeń i linii czasu dla RCA
  • Śledzenie problemów w warstwach za pomocą narzędzi do rozproszonego śledzenia

Automatyzacja i naprawa

  • Wykonywanie automatycznych skryptów lub przepływów pracy z incydentów
  • Integracja z systemami ITSM (ServiceNow, Jira)
  • Przykłady zastosowań: samo-uzdrawianie, skalowanie, przekierowywanie ruchu

Platformy AIOps open source i komercyjne

  • Przegląd narzędzi: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kryteria oceny przy wyborze platformy AIOps
  • Demo i ćwiczenia z wybranym zestawem

Podsumowanie i następne kroki

Wymagania

  • Zrozumienie koncepcji operacji IT i monitorowania systemów
  • Doświadczenie w pracy z narzędziami do monitorowania lub panelem sterowania
  • Znałość podstawowych formatów logów i metryk

Grupa docelowa

  • Zespoły operacyjne odpowiedzialne za infrastrukturę i aplikacje
  • Inżynierowie niezawodności witryn (SRE)
  • Zespoły monitorowania IT i obserwowalności
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie