Plan Szkolenia

Wprowadzenie do Apache Spark

  • Rola Spark w przetwarzaniu dużych danych
  • Architektura Spark i jej składniki

Konfiguracja Apache Spark

  • Wymagania sprzętowe i programowe
  • Procedury instalacji w trybach samodzielnym i klastrowym
  • Najlepsze praktyki konfiguracyjne dla administratorów systemów

Zarządzanie klastrami Spark

  • Narzędzia i techniki zarządzania klastrami
  • Monitorowanie aplikacji Spark i zasobów klastru
  • Konfiguracje zabezpieczeń i zarządzanie użytkownikami

Optymalizacja i dostrajanie wydajności

  • Przypisywanie zasobów i harmonogramowanie
  • Dostrajanie Spark do optymalnej wydajności
  • Wykrywanie i rozwiązywanie typowych wąskich gardzieli

Rozwiązywanie problemów i rozwiązywanie problemów

  • Typowe wyzwania administracyjne Spark
  • Narzędzia diagnostyczne i techniki rozwiązywania problemów
  • Krok po kroku podejście do rozwiązywania typowych problemów
  • Najlepsze praktyki dla utrzymania zdrowego środowiska Spark

Zaawansowane tematy administracyjne

  • Integracja z innymi narzędziami do przetwarzania dużych danych
  • Zapewnienie wysokiej dostępności i odzyskiwanie po awariach
  • Aktualizowanie i skalowanie klastrów Spark

Podsumowanie i następne kroki

Wymagania

  • Podstawowa wiedza na temat konfiguracji i zarządzania siecią
  • Znałosc systemu operacyjnego Linux oraz interfejsu wiersza polecen
  • Zainteresowanie nauką systemów obliczeń rozproszonych oraz zarządzania dużymi danymi

Grupa docelowa

  • Administratorzy systemów
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie