Plan Szkolenia
Wprowadzenie do Google Colab i Apache Spark
- Przegląd programu Google Colab
- Wprowadzenie do Apache Spark
- Konfiguracja Sparka w Google Colab
Przetwarzanie danych za pomocą Apache Spark
- Praca z RDD i DataFrames
- Ładowanie i przetwarzanie dużych zbiorów danych
- Używanie Spark SQL do tworzenia zapytań dotyczących danych strukturalnych
Zaawansowana analityka z wykorzystaniem Sparka
- Uczenie maszynowe za pomocą Spark MLlib
- Przeprowadzanie analizy danych w czasie rzeczywistym
- Obliczenia rozproszone z wykorzystaniem Spark
Wizualizacja i Collaboration w Google Colab
- Integracja programu Colab z popularnymi bibliotekami wizualizacji
- Wspólne przepływy pracy z notatnikami Colab
- Udostępnianie i eksportowanie wyników
Optymalizacja Big Data przepływów pracy
- Dostrajanie Sparka pod kątem wydajności
- Optymalizacja wykorzystania pamięci i magazynu
- Skalowanie przepływów pracy dla dużych zbiorów danych
Big Data w chmurze
- Integracja Google Colab z narzędziami opartymi na chmurze
- Korzystanie z pamięci masowej w chmurze dla dużych zbiorów danych
- Praca ze Sparkiem w rozproszonych środowiskach chmurowych
Studia przypadków i najlepsze praktyki
- Przegląd rzeczywistych aplikacji big data
- Studia przypadków z wykorzystaniem Apache Spark i Colab
- Najlepsze praktyki w zakresie analizy dużych zbiorów danych
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa znajomość koncepcji nauki o danych
- Znajomość Apache Spark
- Python umiejętności programowania
Uczestnicy
- Naukowcy zajmujący się danymi
- Inżynierowie danych
- Badacze pracujący z dużymi zbiorami danych
Opinie uczestników (5)
Praktyczne przykłady pozwoliły nam odczuć, jak naprawdę działa program. Szczegółowe wyjaśnienia i integracja koncepcji teoretycznych z ich praktycznymi zastosowaniami.
Ian - Archeoworks Inc.
Szkolenie - ArcGIS Fundamentals
Przetłumaczone przez sztuczną inteligencję
Ćwiczenie laboratoryjne
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Szkolenie - Automated Monitoring with Zabbix
Przetłumaczone przez sztuczną inteligencję
Wszystkie tematy, które omówił, wraz z przykładami. Wyjaśnił również, jak są one pomocne w naszej codziennej pracy.
madduri madduri - Boskalis Singapore Pte Ltd
Szkolenie - QGIS for Geographic Information System
Przetłumaczone przez sztuczną inteligencję
Polubiałem styl Pabla, fakt, że poruszył wiele tematów od projektowania raportów i personalizacji za pomocą HTML do implementacji prostych algorytmów uczenia maszynowego. Good równowagi między informacjami teoretycznymi a ćwiczeniami. Pablo naprawdę obejrzał wszystkie tematy, które mnie interesowały i udzielił kompleksowych odpowiedzi na moje pytania.
Cristian Tudose - SC Automobile Dacia SA
Szkolenie - Advanced Data Analysis with TIBCO Spotfire
Przetłumaczone przez sztuczną inteligencję
Aktualne zastosowanie Spotfire i wszystkie podstawowe funkcje.
Michael Capili - STMicroelectronics, Inc.
Szkolenie - Introduction to Spotfire
Przetłumaczone przez sztuczną inteligencję