Plan Szkolenia
Wprowadzenie do Apache Spark
- Rola Spark w przetwarzaniu dużych zbiorów danych
- Architektura Spark i jej komponenty
Konfiguracja Apache Spark
- Wymagania sprzętowe i programowe
- Procedury instalacji w trybach standalone i klastrowym
- Najlepsze praktyki konfiguracji dla administratorów systemów
Administracja klastrami Spark
- Narzędzia i techniki zarządzania klastrem
- Monitorowanie aplikacji Spark i zasobów klastra
- Konfiguracje bezpieczeństwa i zarządzanie użytkownikami
Dostrajanie wydajności i optymalizacja
- Alokacja zasobów i planowanie
- Dostrajanie Sparka dla optymalnej wydajności
- Identyfikowanie i rozwiązywanie typowych wąskich gardeł
Rozwiązywanie problemów
- Typowe wyzwania w administracji Spark
- Narzędzia diagnostyczne i techniki rozwiązywania problemów
- Krok po kroku podejście do rozwiązywania typowych problemów
- Najlepsze praktyki utrzymania zdrowego środowiska Spark
Zaawansowane tematy administracyjne
- Integracja z innymi narzędziami do przetwarzania dużych zbiorów danych
- Zapewnianie wysokiej dostępności i odzyskiwania po awariach
- Aktualizacja i skalowanie klastrów Spark
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa wiedza na temat konfiguracji i zarządzania siecią
- Znajomość systemu operacyjnego Linux i interfejsu wiersza poleceń
- Zainteresowanie nauką systemów przetwarzania rozproszonego i zarządzania dużymi zbiorami danych
Grupa docelowa
- Administratorzy systemów
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Fakt, że mogliśmy zabrać ze sobą większość informacji/kursu/prezentacji/zadań, które wykonaliśmy, dzięki czemu możemy się nimi przyjrzeć i ewentualnie powtórzyć to, co nie zrozumieliśmy od razu, lub poprawić to, co już zrobiliśmy.
Raul Mihail Rat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Dostateczna praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o strumieniowaniu Spark, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję