Plan Szkolenia
Wprowadzenie
- Przegląd funkcji i architektury Spark i Hadoop
- Zrozumienie dużych zbiorów danych
- Podstawy programowania Python
Pierwsze kroki
- Konfiguracja Python, Spark i Hadoop
- Zrozumienie struktur danych w Python
- Zrozumienie interfejsu API PySpark
- Zrozumienie HDFS i MapReduce
Integracja Sparka i Hadoop z Python
- Wdrażanie Spark RDD w Python
- Przetwarzanie danych przy użyciu MapReduce
- Tworzenie rozproszonych zbiorów danych w HDFS
Przetwarzanie Machine Learning za pomocą Spark MLlib
Przetwarzanie Big Data z Spark Streaming
Praca z systemami rekomendacji
Praca z Kafką, Sqoop, Kafką i Flume
Apache Mahout ze Spark i Hadoop
Rozwiązywanie problemów
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie ze Sparkiem i Hadoop
- Python doświadczenie w programowaniu
Publiczność
- Naukowcy zajmujący się danymi
- Programiści
Opinie uczestników (3)
Fakt, że mogliśmy zabrać ze sobą większość informacji/kursu/prezentacji/zadań, które wykonaliśmy, dzięki czemu możemy się nimi przyjrzeć i ewentualnie powtórzyć to, co nie zrozumieliśmy od razu, lub poprawić to, co już zrobiliśmy.
Raul Mihail Rat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
Podobało mi się, że udało mu się położyć podstawy tematu i przejść do niektórych dość zaawansowanych ćwiczeń. Ponadto zapewniał łatwe sposoby pisania i testowania kodu.
Ionut Goga - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
Żywe przykłady
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję