Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Projektowanie otwartej architektury AIOps
- Przegląd kluczowych komponentów w otwartych potokach AIOps
- Przepływ danych od pozyskania do powiadamiania
- Porównanie narzędzi i strategia integracji
Zbieranie i agregacja danych
- Pozyskiwanie danych szeregów czasowych za pomocą Prometheusa
- Przechwytywanie logów za pomocą Logstash i Beats
- Normalizacja danych dla korelacji między źródłami
Budowanie paneli obserwowalności
- Wizualizacja metryk za pomocą Grafany
- Tworzenie paneli Kibana do analizy logów
- Korzystanie z zapytań Elasticsearch do wyodrębniania operacyjnych spostrzeżeń
Wykrywanie anomalii i przewidywanie incydentów
- Eksportowanie danych obserwowalności do potoków Python
- Trenowanie modeli ML do wykrywania odstępstw i prognozowania
- Wdrażanie modeli do inferencji na żywo w potoku obserwowalności
Powiadamianie i automatyzacja z wykorzystaniem otwartych narzędzi
- Tworzenie reguł powiadomień Prometheusa i routingu Alertmanagera
- Wyzwalanie skryptów lub przepływów API do automatycznej odpowiedzi
- Korzystanie z otwartych narzędzi do orkiestracji (np. Ansible, Rundeck)
Zagadnienia integracji i skalowalności
- Obsługa pozyskiwania dużych ilości danych i długoterminowego przechowywania
- Bezpieczeństwo i kontrola dostępu w stosach open source
- Skalowanie każdej warstwy niezależnie: pozyskiwanie, przetwarzanie, powiadamianie
Praktyczne zastosowania i rozszerzenia
- Studia przypadków: optymalizacja wydajności, zapobieganie przestojom i optymalizacja kosztów
- Rozszerzanie potoków o narzędzia do śledzenia lub grafów usług
- Najlepsze praktyki w zakresie uruchamiania i utrzymywania AIOps w produkcji
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie w korzystaniu z narzędzi do obserwowalności, takich jak Prometheus lub ELK
- Znajomość Pythona i podstaw uczenia maszynowego
- Zrozumienie operacji IT i przepływów powiadomień
Grupa docelowa
- Zaawansowani inżynierowie niezawodności witryn (SRE)
- Inżynierowie danych pracujący w operacjach
- Liderzy platform DevOps i architekci infrastruktury
14 godzin