Plan Szkolenia

Wprowadzenie do predykcyjnego AIOps

  • Przegląd analityki predykcyjnej w operacjach IT
  • Źródła danych do prognozowania (logi, metryki, zdarzenia)
  • Kluczowe koncepcje w prognozowaniu szeregów czasowych i wzorcach anomalii

Projektowanie modeli prognozowania incydentów

  • Etykietowanie historycznych incydentów i zachowań systemu
  • Wybór i trenowanie modeli (np. LSTM, Random Forest, AutoML)
  • Ocena wydajności modeli i zarządzanie fałszywymi alarmami

Zbieranie danych i inżynieria cech

  • Pobieranie i synchronizacja logów i metryk jako danych wejściowych dla modeli
  • Ekstrakcja cech z danych strukturalnych i niestrukturalnych
  • Zarządzanie szumem i brakującymi danymi w potokach operacyjnych

Automatyzacja analizy przyczyn źródłowych (RCA)

  • Korelacja oparta na grafach usług i infrastruktury
  • Wykorzystanie ML do wnioskowania prawdopodobnych przyczyn źródłowych z łańcuchów zdarzeń
  • Wizualizacja RCA za pomocą paneli sterowania uwzględniających topologię

Automatyzacja naprawy i przepływów pracy

  • Integracja z platformami automatyzacji (np. Ansible, Rundeck)
  • Wyzwalanie wycofywania, restartów lub przekierowania ruchu
  • Audytowanie i dokumentowanie zautomatyzowanych interwencji

Skalowanie inteligentnych potoków AIOps

  • MLOps dla obserwowalności: ponowne trenowanie i wersjonowanie modeli
  • Realizacja prognoz w czasie rzeczywistym na rozproszonych węzłach
  • Najlepsze praktyki wdrażania AIOps w środowiskach produkcyjnych

Studia przypadków i praktyczne zastosowania

  • Analiza rzeczywistych danych incydentów przy użyciu modeli predykcyjnego AIOps
  • Wdrażanie potoków RCA z danymi syntetycznymi i produkcyjnymi
  • Przegląd przypadków użycia w branży: awarie chmury, niestabilność mikrousług, degradacje sieci

Podsumowanie i kolejne kroki

Wymagania

  • Doświadczenie w pracy z systemami monitorowania, takimi jak Prometheus lub ELK
  • Znajomość Pythona i podstaw uczenia maszynowego
  • Znajomość przepływów pracy związanych z zarządzaniem incydentami

Grupa docelowa

  • Starszy inżynierowie niezawodności stron (SRE)
  • Architekci automatyzacji IT
  • Liderzy platform DevOps i obserwowalności
 14 godzin

Liczba uczestników


Cena za uczestnika

Propozycje terminów

Powiązane Kategorie