Plan Szkolenia
Wprowadzenie do Google Colab i Apache Spark
- Przegląd Google Colab
- Wprowadzenie do Apache Spark
- Konfiguracja Spark w Google Colab
Przetwarzanie danych za pomocą Apache Spark
- Praca z RDD i DataFrames
- Wczytywanie i przetwarzanie dużych zbiorów danych
- Używanie Spark SQL do zapytywania strukturowanych danych
Zaawansowana analiza z użyciem Spark
- Maszynowe uczenie się z użyciem Spark MLlib
- Przeprowadzanie analizy danych w czasie rzeczywistym
- Obliczenia rozproszone z użyciem Spark
Wizualizacja i Collaboration w Google Colab
- Integracja Colab z popularnymi bibliotekami wizualizacyjnymi
- Współpracownicze przepływy pracy z notebookami Colab
- Udostępnianie i eksportowanie wyników
Optymalizacja przepływów pracy Big Data
- Dostosowywanie Spark do osiągnięcia optymalnej wydajności
- Optymalizacja zużycia pamięci i przestrzeni dyskowej
- Skalowanie przepływów pracy do dużych zbiorów danych
Big Data w Chmurze
- Integracja Google Colab z narzędziami opartymi na chmurze
- Używanie chmurowego przechowywania dla dużych danych
- Praca z Spark w rozproszonym środowisku chmurowym
Studia przypadków i najlepsze praktyki
- Przegląd realnych zastosowań dużych danych
- Studia przypadków z użyciem Apache Spark i Colab
- Najlepsze praktyki dla analizy dużych danych
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa wiedza na temat pojęć nauki o danych
- Znajomość Apache Spark
- Umiejętności programowania Python
Grupa docelowa
- Naukowcy danych
- Inżynierowie danych
- Badacze pracujący z big data
Opinie uczestników (5)
Praktyczne przykłady pozwoliły nam odczuć, jak naprawdę działa program. Szczegółowe wyjaśnienia i integracja koncepcji teoretycznych z ich praktycznymi zastosowaniami.
Ian - Archeoworks Inc.
Szkolenie - ArcGIS Fundamentals
Przetłumaczone przez sztuczną inteligencję
Ćwiczenie laboratoryjne
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Szkolenie - Automated Monitoring with Zabbix
Przetłumaczone przez sztuczną inteligencję
Wszystkie tematy, które omówił, wraz z przykładami. Wyjaśnił również, jak są one pomocne w naszej codziennej pracy.
madduri madduri - Boskalis Singapore Pte Ltd
Szkolenie - QGIS for Geographic Information System
Przetłumaczone przez sztuczną inteligencję
Polubiałem styl Pabla, fakt, że poruszył wiele tematów od projektowania raportów i personalizacji za pomocą HTML do implementacji prostych algorytmów uczenia maszynowego. Good równowagi między informacjami teoretycznymi a ćwiczeniami. Pablo naprawdę obejrzał wszystkie tematy, które mnie interesowały i udzielił kompleksowych odpowiedzi na moje pytania.
Cristian Tudose - SC Automobile Dacia SA
Szkolenie - Advanced Data Analysis with TIBCO Spotfire
Przetłumaczone przez sztuczną inteligencję
Aktualne zastosowanie Spotfire i wszystkie podstawowe funkcje.
Michael Capili - STMicroelectronics, Inc.
Szkolenie - Introduction to Spotfire
Przetłumaczone przez sztuczną inteligencję