Plan Szkolenia

Wprowadzenie do Apache Spark

  • Rola Spark w przetwarzaniu dużych zbiorów danych
  • Architektura Spark i jej komponenty

Konfiguracja Apache Spark

  • Wymagania sprzętowe i programowe
  • Procedury instalacji w trybach standalone i klastrowym
  • Najlepsze praktyki konfiguracji dla administratorów systemów

Administracja klastrami Spark

  • Narzędzia i techniki zarządzania klastrem
  • Monitorowanie aplikacji Spark i zasobów klastra
  • Konfiguracje bezpieczeństwa i zarządzanie użytkownikami

Dostrajanie wydajności i optymalizacja

  • Alokacja zasobów i planowanie
  • Dostrajanie Sparka dla optymalnej wydajności
  • Identyfikowanie i rozwiązywanie typowych wąskich gardeł

Rozwiązywanie problemów

  • Typowe wyzwania w administracji Spark
  • Narzędzia diagnostyczne i techniki rozwiązywania problemów
  • Krok po kroku podejście do rozwiązywania typowych problemów
  • Najlepsze praktyki utrzymania zdrowego środowiska Spark

Zaawansowane tematy administracyjne

  • Integracja z innymi narzędziami do przetwarzania dużych zbiorów danych
  • Zapewnianie wysokiej dostępności i odzyskiwania po awariach
  • Aktualizacja i skalowanie klastrów Spark

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowa wiedza na temat konfiguracji i zarządzania siecią
  • Znajomość systemu operacyjnego Linux i interfejsu wiersza poleceń
  • Zainteresowanie nauką systemów przetwarzania rozproszonego i zarządzania dużymi zbiorami danych

Grupa docelowa

  • Administratorzy systemów
 35 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (2)

Propozycje terminów

Powiązane Kategorie