Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie do Apache Spark
- Rola Spark w przetwarzaniu dużych zbiorów danych
- Architektura Spark i jej komponenty
Konfiguracja Apache Spark
- Wymagania sprzętowe i programowe
- Procedury instalacji w trybach standalone i klastrowym
- Najlepsze praktyki konfiguracji dla administratorów systemów
Administracja klastrami Spark
- Narzędzia i techniki zarządzania klastrem
- Monitorowanie aplikacji Spark i zasobów klastra
- Konfiguracje bezpieczeństwa i zarządzanie użytkownikami
Dostrajanie wydajności i optymalizacja
- Alokacja zasobów i planowanie
- Dostrajanie Sparka dla optymalnej wydajności
- Identyfikowanie i rozwiązywanie typowych wąskich gardeł
Rozwiązywanie problemów
- Typowe wyzwania w administracji Spark
- Narzędzia diagnostyczne i techniki rozwiązywania problemów
- Krok po kroku podejście do rozwiązywania typowych problemów
- Najlepsze praktyki utrzymania zdrowego środowiska Spark
Zaawansowane tematy administracyjne
- Integracja z innymi narzędziami do przetwarzania dużych zbiorów danych
- Zapewnianie wysokiej dostępności i odzyskiwania po awariach
- Aktualizacja i skalowanie klastrów Spark
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa wiedza na temat konfiguracji i zarządzania siecią
- Znajomość systemu operacyjnego Linux i interfejsu wiersza poleceń
- Zainteresowanie nauką systemów przetwarzania rozproszonego i zarządzania dużymi zbiorami danych
Grupa docelowa
- Administratorzy systemów
35 godzin
Opinie uczestników (2)
ankieta przed szkoleniem i zastosowanie jej wynikow.
Krzysztof - Alfa Laval
Szkolenie - Python and Spark for Big Data (PySpark)
Zaangażowanie i chęć wyjaśnienia tematów pobocznych.