Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie do AIOps z wykorzystaniem narzędzi open source

  • Przegląd koncepcji i korzyści AIOps
  • Prometheus i Grafana w stosie obserwowalności
  • Miejsce ML w AIOps: analiza predykcyjna vs. reaktywna

Konfiguracja Prometheusa i Grafany

  • Instalacja i konfiguracja Prometheusa do zbierania szeregów czasowych
  • Tworzenie dashboardów w Grafanach z wykorzystaniem metryk w czasie rzeczywistym
  • Eksploracja eksporterów, relabelingu i wykrywania usług

Przetwarzanie wstępne danych dla ML

  • Ekstrakcja i transformacja metryk z Prometheusa
  • Przygotowywanie zbiorów danych do wykrywania anomalii i prognozowania
  • Wykorzystanie transformacji Grafany lub potoków w Pythonie

Zastosowanie uczenia maszynowego do wykrywania anomalii

  • Podstawowe modele ML do wykrywania odstępstw (np. Isolation Forest, One-Class SVM)
  • Trenowanie i ewaluacja modeli na danych szeregów czasowych
  • Wizualizacja anomalii na dashboardach Grafany

Prognozowanie metryk z wykorzystaniem ML

  • Budowanie prostych modeli prognozowania (ARIMA, Prophet, wprowadzenie do LSTM)
  • Przewidywanie obciążenia systemu lub wykorzystania zasobów
  • Wykorzystanie prognoz do wczesnego alertowania i decyzji skalowania

Integracja ML z alertami i automatyzacją

  • Definiowanie reguł alertów na podstawie wyników ML lub progów
  • Wykorzystanie Alertmanagera i routingu powiadomień
  • Wyzwalanie skryptów lub przepływów automatyzacji po wykryciu anomalii

Skalowanie i operacjonalizacja AIOps

  • Integracja zewnętrznych narzędzi obserwowalności (np. ELK stack, Moogsoft, Dynatrace)
  • Operacjonalizacja modeli ML w potokach obserwowalności
  • Najlepsze praktyki dotyczące AIOps na dużą skalę

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie koncepcji monitorowania systemów i obserwowalności
  • Doświadczenie w korzystaniu z Grafany lub Prometheusa
  • Znajomość Pythona i podstawowych zasad uczenia maszynowego

Grupa docelowa

  • Inżynierowie obserwowalności
  • Zespoły infrastruktury i DevOps
  • Architekci platform monitorowania i inżynierowie niezawodności stron (SREs)
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Propozycje terminów

Powiązane Kategorie