Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Wprowadzenie do Predictive AIOps
- Przegląd analityki predykcyjnej w operacjach IT
- Źródła danych do predykcji (logi, metryki, zdarzenia)
- Kluczowe koncepcje w prognozowaniu szeregów czasowych i wzorcach anomalii
Projektowanie modeli przewidywania incydentów
- Etykietowanie historycznych incydentów i zachowań systemu
- Wybieranie i szkolenie modeli (np. LSTM, Random Forest, AutoML)
- Ocena wydajności modelu i obsługa fałszywych pozytywnych
Zbieranie danych i inżynieria cech
- Przyjmowanie i synchronizowanie danych logów i metryk do wejścia modelu
- Ekstrakcja cech z danych strukturalnych i nieskuturalnych
- Obsługa szumów i braków danych w operacyjnych potokach
Automatyzacja analizy przyczyny pierwszego (RCA)
- Korelacja usług i infrastruktury oparta na grafach
- Używanie ML do wyciągania prawdopodobnych przyczyn z łańcuchów zdarzeń
- Wizualizacja RCA za pomocą pulpitów z informacją o topologii
Naprawa i Workflow Automation
- Integracja z platformami automatyzacji (np. Ansible, Rundeck)
- Wybieranie cofnięć, ponownego uruchomienia lub przekierowania ruchu
- Audytowanie i dokumentowanie automatycznych interwencji
Skalowanie inteligentnych potoków AIOps
- MLOps dla obserwowalności: ponowne szkolenie i wersjonowanie modeli
- Uruchamianie prognoz w czasie rzeczywistym na rozproszonych węzłach
- Najlepsze praktyki dla wdrażania AIOps w środowiskach produkcyjnych
Przypady studyjne i praktyczne zastosowania
- Analiza rzeczywistych danych incydentów za pomocą predykcyjnych modeli AIOps
- Wdrażanie potoków RCA z użyciem danych syntetycznych i produkcyjnych
- Przegląd przypadków branżowych: awarie chmurowe, niestabilność mikroserwisów, degradacja sieci
Podsumowanie i kolejne kroki
Wymagania
Doświadczenie z systemami monitorowania, takimi jak Prometheus lub ELK
Znawstwo Python i podstawowych technik uczenia maszynowego
Znawstwo procesów zarządzania incydentami
**Grupa docelowa**
Starszy inżynierowie niezawodności (SRE)
Architekci automatyzacji IT
Liderzy w dziedzinie DevOps i platform obserwacyjnych
14 godzin