Plan Szkolenia

Wprowadzenie do AIOps z narzędziami Open Source

  • Przegląd koncepcji i korzyści AIOps
  • Prometheus i Grafana w stosie obserwowalności
  • Gdzie ML mieści się w AIOps: analityka predykcyjna vs. reaktywna

Konfiguracja Prometheus i Grafana

  • Instalowanie i konfigurowanie Prometheus do zbierania danych czasowych
  • Tworzenie wizualizacji w Grafana z użyciem danych w czasie rzeczywistym
  • Badanie eksportów, ponownego etykietowania i odkrywania usług

Przygotowanie danych do ML

  • Ekstrahowanie i transformowanie metryk Prometheus
  • Przygotowanie zestawów danych do wykrywania anomalii i prognozowania
  • Używanie transformacji Grafana lub rurociągów Python

Zastosowanie Machine Learning do wykrywania anomalii

  • Podstawowe modele ML do wykrywania danech odchylających (np. Isolation Forest, One-Class SVM)
  • Trenowanie i ocena modeli na danych czasowych
  • Wizualizowanie anomalii w wizualizacjach Grafana

Metryki Forecasting z ML

  • Budowanie prostych modeli prognozowania (ARIMA, Prophet, wprowadzenie do LSTM)
  • Prognozowanie obciążenia systemu lub zużycia zasobów
  • Używanie prognoz do wczesnego ostrzegania i podejmowania decyzji o skalowaniu

Integracja ML z ostrzeganiem i automatyzacją

  • Definiowanie zasad ostrzegania na podstawie wyjściowych danych ML lub progów
  • Używanie Alertmanager i routingu powiadomień
  • Wyzwalanie skryptów lub przepływów pracy automatyzacji po wykryciu anomalii

Skalowanie i operatywne wdrażanie AIOps

  • Integracja zewnętrznych narzędzi obserwowalności (np. ELK stack, Moogsoft, Dynatrace)
  • Operatywne wdrażanie modeli ML w rurociągach obserwowalności
  • Najlepsze praktyki dla AIOps w skali

Podsumowanie i następne kroki

Wymagania

  • Rozumienie pojęć monitorowania systemów i obserwowalności
  • Doświadczenie w używaniu Grafana lub Prometheus
  • Znałość z Python i podstawowych zasad uczenia maszynowego

Grupa docelowa

  • Inżynierowie obserwowalności
  • Zespoły infrastruktury i DevOps
  • Architekci platform monitorowania i inżynierowie niezawodności (SRE)
 14 godzin

Liczba uczestników


cena netto za uczestnika

Propozycje terminów

Powiązane Kategorie