Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie do predykcyjnego AIOps
- Przegląd analityki predykcyjnej w operacjach IT
- Źródła danych do prognozowania (logi, metryki, zdarzenia)
- Kluczowe koncepcje w prognozowaniu szeregów czasowych i wzorcach anomalii
Projektowanie modeli prognozowania incydentów
- Etykietowanie historycznych incydentów i zachowań systemu
- Wybór i trenowanie modeli (np. LSTM, Random Forest, AutoML)
- Ocena wydajności modeli i zarządzanie fałszywymi alarmami
Zbieranie danych i inżynieria cech
- Pobieranie i synchronizacja logów i metryk jako danych wejściowych dla modeli
- Ekstrakcja cech z danych strukturalnych i niestrukturalnych
- Zarządzanie szumem i brakującymi danymi w potokach operacyjnych
Automatyzacja analizy przyczyn źródłowych (RCA)
- Korelacja oparta na grafach usług i infrastruktury
- Wykorzystanie ML do wnioskowania prawdopodobnych przyczyn źródłowych z łańcuchów zdarzeń
- Wizualizacja RCA za pomocą paneli sterowania uwzględniających topologię
Automatyzacja naprawy i przepływów pracy
- Integracja z platformami automatyzacji (np. Ansible, Rundeck)
- Wyzwalanie wycofywania, restartów lub przekierowania ruchu
- Audytowanie i dokumentowanie zautomatyzowanych interwencji
Skalowanie inteligentnych potoków AIOps
- MLOps dla obserwowalności: ponowne trenowanie i wersjonowanie modeli
- Realizacja prognoz w czasie rzeczywistym na rozproszonych węzłach
- Najlepsze praktyki wdrażania AIOps w środowiskach produkcyjnych
Studia przypadków i praktyczne zastosowania
- Analiza rzeczywistych danych incydentów przy użyciu modeli predykcyjnego AIOps
- Wdrażanie potoków RCA z danymi syntetycznymi i produkcyjnymi
- Przegląd przypadków użycia w branży: awarie chmury, niestabilność mikrousług, degradacje sieci
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie w pracy z systemami monitorowania, takimi jak Prometheus lub ELK
- Znajomość Pythona i podstaw uczenia maszynowego
- Znajomość przepływów pracy związanych z zarządzaniem incydentami
Grupa docelowa
- Starszy inżynierowie niezawodności stron (SRE)
- Architekci automatyzacji IT
- Liderzy platform DevOps i obserwowalności
14 godzin