Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Projektowanie otwartej architektury AIOps
- Przegląd kluczowych komponentów w otwartych rurach AIOps
- Przepływ danych od wczytywania do alertowania
- Porównanie narzędzi i strategia integracji
Zbieranie i agregacja danych
- Wczytywanie danych czasowych z Prometheus
- Zbieranie logów z Logstash i Beats
- Normalizowanie danych dla korygacji źródła
Budowanie dashboradów obserwowalności
- Wizualizowanie metryk z Grafana
- Budowanie dashboradów Kibana do analizy logów
- Używanie zapytań Elasticsearch do wyciągania wglądu operacyjnego
Wykrywanie anomalii i prognozowanie incydentów
- Eksportowanie danych obserwowalności do rur Python
- Trenowanie modeli ML do wykrywania odstępstw i prognozowania
- Wdrażanie modeli do live inference w rurze obserwowalności
Alertowanie i automatyzacja z otwartymi narzędziami
- Tworzenie reguł alertów Prometheus i routingu Alertmanager
- Wykonywanie skryptów lub API workflowów do automatycznego reagowania
- Używanie otwartych narzędzi orchestracji (np. Ansible, Rundeck)
Integracja i rozważania skalowalności
- Obsługa wysokiej objętości wczytywania i długoterminowego przechowywania
- Bezpieczeństwo i kontrola dostępu w otwartych stosach
- Skalowanie każdej warstwy niezależnie: wczytywanie, przetwarzanie, alertowanie
Prawdziwe zastosowania i rozszerzenia
- Studia przypadków: optymalizacja wydajności, zapobieganie przerwom i optymalizacja kosztów
- Rozszerzanie rur z narzędziami śledzenia lub grafami usług
- Najlepsze praktyki dla uruchamiania i utrzymywania AIOps w produkcji
Podsumowanie i następne kroki
Wymagania
- Doświadczenie z narzędziami do monitorowania, takimi jak Prometheus lub ELK
- Znajomość Python i podstaw uczenia maszynowego
- Zrozumienie operacji IT i przepływów powiadamiania
Grupa docelowa
- Zaawansowani inżynierowie odpowiedzialni za niezawodność systemów (SRE)
- Inżynierowie danych pracujący w operacjach
- Liderzy platformy DevOps i architektowie infrastruktury
14 godzin