Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie do predykcyjnego AIOps
- Przegląd analizy predykcyjnej w operacjach IT
- Źródła danych do przewidywania (dzienniki, metryki, zdarzenia)
- Kluczowe koncepcje w prognozowaniu szeregów czasowych i wzorcach anomalii
Projektowanie modeli przewidywania incydentów
- Oznaczanie historycznych incydentów i zachowania systemu
- Wybieranie i trenowanie modeli (np. LSTM, Random Forest, AutoML)
- Ocena wydajności modeli i obszuga fałszywych pozytywnych wyników
Zbieranie danych i inżynieria cech
- Importowanie i wyrównywanie danych dzienników i metryk do wejścia modelu
- Wyodrębnianie cech z danych strukturyzowanych i niestrukturyzowanych
- Obsługa szumów i brakujących danych w potokach operacyjnych
Automatyzacja analizy przyczyn podstawowych (RCA)
- Korelacja graficzna usług i infrastruktury
- Używanie ML do wnioskowania o prawdopodobnych przyczynach podstawowych z łańcuchów zdarzeń
- Wizualizacja RCA za pomocą paneli kontrolnych świadomych topologii
Naprawa i automatyzacja przepływów pracy
- Integracja z platformami automatyzacji (np. Ansible, Rundeck)
- Wyzwalanie cofnięć, ponownych uruchomień lub przekierowywania ruchu
- Audytowanie i dokumentowanie automatycznych interwencji
Skalowanie inteligentnych potoków AIOps
- MLOps dla obserwowalności: ponowne trenowanie i wersjonowanie modeli
- Uruchamianie przewidywań w czasie rzeczywistym na rozproszonych węzłach
- Najlepsze praktyki wdrażania AIOps w środowiskach produkcyjnych
Studia przypadków i praktyczne zastosowania
- Analiza rzeczywistych danych incydentów przy użyciu modeli predykcyjnych AIOps
- Wdrażanie potoków RCA z danymi syntetycznymi i produkcyjnymi
- Przegląd przypadków zastosowania branżowych: awarie w chmurze, niestabilność mikroserwisów, degradacje sieciowe
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie w systemach monitoringu takich jak Prometheus lub ELK
- Praktyczna znajomość Pythona i podstawowego uczenia maszynowego
- Znajomość przepływów pracy zarządzania incydentami
Odbiorcy
- Starsi inżynierowie niezawodności serwisowej (SRE)
- Architekci automatyzacji IT
- Liderzy platform DevOps i obserwowalności
14 godzin