Plan Szkolenia
- Podstawa Scala Szybkie wprowadzenie do Scala Labs: Poznanie podstaw Scala Spark Tło i historia Spark i Hadoop Koncepcje i architektura Spark Eco system Spark (core, spark sql, mlib, streaming) Labs: Instalowanie i uruchamianie Sparka Pierwsze spojrzenie na Sparka Działającego Sparka tryb lokalny Spark web UI Spark Shell Analiza zbioru danych – część 1 Inspekcja RDD Laboratoria: Eksploracja powłoki Spark RDD Koncepcje RDD Partycje RDD Operacje / transformacje Typy RDD Para klucz-wartość RDD MapReduce na RDD Buforowanie i trwałość Laboratoria: tworzenie i sprawdzanie RDD; Buforowanie RDD Programowanie Spark API Wprowadzenie do Spark API / RDD API Przesyłanie pierwszego programu do Spark Debugowanie / logowanie Właściwości konfiguracyjne Laboratoria: Programowanie w Spark API, Przesyłanie zadań Obsługa Spark SQL SQL w Spark Dataframes Definiowanie tabel i importowanie zbiorów danych Wykonywanie zapytań o dane ramki przy użyciu SQL Formatów przechowywania: JSON / Parquet Labs: Tworzenie i wysyłanie zapytań do ramek danych; ocenianie formatów danych MLlib Wprowadzenie do MLlib Algorytmy MLlib Laboratoria: Pisanie aplikacji MLib GraphX Przegląd bibliotek GraphX Laboratoria GraphX API: Przetwarzanie danych wykresów za pomocą Spark Spark Streaming Przegląd przesyłania strumieniowego Ocena platform przesyłania strumieniowego Operacje strumieniowe Operacje w przesuwanych oknach Laboratoria: Pisanie aplikacji do strumieniowego przesyłania strumieniowego Spark i Hadoop Hadoop Wprowadzenie ( HDFS / YARN) Architektura Hadoop + Spark Uruchamianie Spark na Hadoop YARN Przetwarzanie plików HDFS przy użyciu Spark Spark Wydajność i strojenie Zmienne rozgłoszeniowe Akumulatory Zarządzanie pamięcią i buforowanie Operacje Spark Wdrażanie Spark w środowisku produkcyjnym Przykładowe szablony wdrożeń Konfiguracje Monitorowanie Rozwiązywanie problemów
Wymagania
WYMAGANIA WSTĘPNE
znajomość języka Java / Scala / Python (nasze laboratoria w Scala i Pythonie) podstawowa znajomość środowiska programistycznego Linux (nawigacja w wierszu poleceń / edycja plików za pomocą VI lub nano)
Opinie uczestników (7)
Wszystko ok.
Marek Siodmiak - Santander Bank Polska
Szkolenie - Spark for Developers
Wykonywanie podobnych ćwiczeń różnymi sposobami naprawdę pomaga zrozumieć, co każdy składnik (Hadoop/Spark, standalone/cluster) może zrobić samodzielnie i razem. To dało mi pomysły na to, jak powinienem testować moją aplikację na mojej lokalnej maszynie podczas rozwoju w porównaniu do momentu, gdy jest wdrażana na klastrze.
Thomas Carcaud - IT Frankfurt GmbH
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Ajay był bardzo przyjazny, pomocny i również dobrze orientował się w temacie, o którym mówił.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Ernesto świetnie wyjaśnił pojęcia ogólne dotyczące używania Spark i jego różnych modułów.
Michael Nemerouf
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Uczelnia była interesująca i zabawna, co bardzo pomaga podczas całodniowego szkolenia.
Ryan Speelman
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Myślimy dużo więcej o całym środowisku.
John Kidd
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję
Richard jest bardzo spokojny i metodyczny, posiadający analityczne wyczucie - dokładnie te cechy, które są potrzebne do prowadzenia tego typu kursu.
Kieran Mac Kenna
Szkolenie - Spark for Developers
Przetłumaczone przez sztuczną inteligencję