Apache Spark in the Cloud - Plan Szkolenia

Krzywa uczenia się Apache Spark powoli rośnie na początku, wymaga dużo wysiłku, aby uzyskać pierwszy zwrot. Ten kurs ma na celu przeskoczenie pierwszej trudnej części. Po ukończeniu tego kursu uczestnicy zrozumieją podstawy Apache Spark , będą wyraźnie odróżniać RDD od DataFrame, nauczą się Pythona i Scala API, zrozumieją executory i zadania itp. Również zgodnie z najlepszymi praktykami, kurs ten silnie koncentruje się na wdrażaniu w chmurze, Databricks i AWS. Studenci zrozumieją również różnice między AWS EMR i AWS Glue, jedną z najnowszych usług Spark w AWS.

AUDIENCJA:

Inżynier ds. danych, DevOps, Naukowiec ds. danych

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Plan Szkolenia

Wstęp:

Apache Spark w Hadoop Ekosystem
Krótkie wprowadzenie do Pythona, Scala

Podstawy (teoria):

Architektura
RDD
Transformacja i działania
Etap, zadanie, zależności

Korzystanie ze środowiska Databricks pozwala zrozumieć podstawy (warsztat praktyczny):

Ćwiczenia z wykorzystaniem RDD API
Podstawowe funkcje akcji i transformacji
ParaRDD
Dołączyć
Strategie buforowania
Ćwiczenia z wykorzystaniem DataFrame API
IskraSQL
DataFrame: wybierz, filtruj, grupuj, sortuj
UDF (funkcja zdefiniowana przez użytkownika)
Patrząc na API DataSet
Transmisja strumieniowa

Korzystanie ze środowiska AWS obejmuje zrozumienie wdrożenia (warsztat praktyczny):

Podstawy kleju AWS
Poznaj różnice między AWS EMR i AWS Glue
Przykładowe zadania w obu środowiskach
Zrozum zalety i wady

Dodatkowy:

Wprowadzenie do orkiestracji Apache Airflow.

Wymagania

Umiejętność programowania (najlepiej w języku python, scala)

Podstawy SQL

21 godzin

Opinie uczestników (2)

Having hands on session / assignments

Poornima Chenthamarakshan - Intelligent Medical Objects

Szkolenie - Apache Spark in the Cloud

1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise

Apache Spark in the Cloud - Plan Szkolenia

Plan Szkolenia

Wymagania

Opinie uczestników (2)

Poornima Chenthamarakshan - Intelligent Medical Objects

Szkolenie - Apache Spark in the Cloud

Steven Wu - Intelligent Medical Objects

Szkolenie - Apache Spark in the Cloud

Powiązane Kategorie

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Apache Spark in the Cloud - Plan Szkolenia

Plan Szkolenia

Wymagania

Opinie uczestników (2)

Poornima Chenthamarakshan - Intelligent Medical Objects

Szkolenie - Apache Spark in the Cloud

Steven Wu - Intelligent Medical Objects

Szkolenie - Apache Spark in the Cloud

Szkolenia Powiązane

Python and Spark for Big Data (PySpark)

Introduction to Graph Computing

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

Apache Spark MLlib

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) for Administrators

A Practical Introduction to Stream Processing

Magellan: Geospatial Analytics on Spark

Apache Spark for .NET Developers

SMACK Stack for Data Science

Apache Spark Fundamentals

Administration of Apache Spark

Spark for Developers

CEL:

AUDIENCJA :

Scaling Data Pipelines with Spark NLP

Powiązane Kategorie

Apache Spark

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites