Plan Szkolenia
-
Wprowadzenie do Scali
- Szybkie wprowadzenie do Scali
- Laboratoria: Poznajemy Scalę
-
Podstawy Sparka
- Tło i historia
- Spark i Hadoop
- Pojęcia i architektura Sparka
- Ekosystem Sparka (core, spark sql, mlib, streaming)
- Laboratoria: Instalacja i uruchamianie Sparka
-
Pierwsze spojrzenie na Sparka
- Uruchamianie Sparka w trybie lokalnym
- Interfejs webowy Sparka
- Powłoka Sparka
- Analiza zbioru danych – część 1
- Inspekcja RDD
- Laboratoria: Eksploracja powłoki Sparka
-
RDD
- Pojęcia RDD
- Partycje
- Operacje / transformacje RDD
- Typy RDD
- RDD typu klucz-wartość
- MapReduce na RDD
- Buforowanie i trwałość
- Laboratoria: Tworzenie i inspekcja RDD; Buforowanie RDD
-
Programowanie w API Sparka
- Wprowadzenie do API Sparka / API RDD
- Przesyłanie pierwszego programu do Sparka
- Debugowanie / logowanie
- Właściwości konfiguracyjne
- Laboratoria: Programowanie w API Sparka, przesyłanie zadań
-
Spark SQL
- Obsługa SQL w Sparku
- Dataframes
- Definiowanie tabel i importowanie zbiorów danych
- Wykonywanie zapytań na data frames przy użyciu SQL
- Formaty przechowywania: JSON / Parquet
- Laboratoria: Tworzenie i wykonywanie zapytań na data frames; ocena formatów danych
-
MLlib
- Wprowadzenie do MLlib
- Algorytmy MLlib
- Laboratoria: Pisanie aplikacji z użyciem MLib
-
GraphX
- Przegląd biblioteki GraphX
- Interfejsy API GraphX
- Laboratoria: Przetwarzanie danych grafowych przy użyciu Sparka
-
Przetwarzanie strumieniowe w Sparku
- Przegląd przetwarzania strumieniowego
- Ocena platform do przetwarzania strumieniowego
- Operacje strumieniowe
- Operacje na przesuwających się oknach
- Laboratoria: Pisanie aplikacji do przetwarzania strumieniowego w Sparku
-
Spark i Hadoop
- Wprowadzenie do Hadoop (HDFS / YARN)
- Architektura Hadoop + Spark
- Uruchamianie Sparka na Hadoop YARN
- Przetwarzanie plików HDFS przy użyciu Sparka
-
Wydajność i optymalizacja Sparka
- Zmienne rozgłoszeniowe
- Akumulatory
- Zarządzanie pamięcią i buforowanie
-
Operacje na Sparku
- Wdrażanie Sparka w produkcji
- Przykładowe szablony wdrożenia
- Konfiguracje
- Monitorowanie
- Rozwiązywanie problemów
Wymagania
WYMAGANIA WSTĘPNE
znajomość jednego z języków: Java / Scala / Python (nasze laboratoria w Scali i Pythonie)
podstawowa znajomość środowiska programistycznego Linux (nawigacja wiersza poleceń / edycja plików przy użyciu VI lub nano)
Opinie uczestników (7)
Wszystko ok.
Marek Siodmiak - Santander Bank Polska
Szkolenie - Spark for Developers
Wykonywanie podobnych ćwiczeń na różne sposoby naprawdę pomaga zrozumieć, co każdy komponent (Hadoop/Spark, samodzielny/klaster) może zrobić samodzielnie i wspólnie. Dało mi to pomysły, jak powinienem testować moją aplikację na lokalnym maszynie podczas jej tworzenia w porównaniu do wdrożenia na klastrze.
Thomas Carcaud - IT Frankfurt GmbH
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Ajay był bardzo przyjazny, pomocny i również dobrze orientował się w temacie, o którym mówił.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
We know a lot more about the whole environment.
John Kidd
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Kieran Mac Kenna
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję