Plan Szkolenia
Wprowadzenie do Apache Iceberg
- Przegląd Apache Iceberg
- Znaczenie i przypadki użycia we współczesnej architekturze danych
- Kluczowe funkcje i zalety
Podstawowe pojęcia
- Format tabeli i architektura Iceberg
- Porównanie z innymi formatami tabel
- Partycjonowanie i ewolucja schematów
- Podróż w czasie i wersjonowanie danych
Konfiguracja Apache Iceberg
- Instalacja i konfiguracja
- Integracja Iceberg z różnymi silnikami przetwarzania danych
- Konfiguracja środowiska Iceberg na lokalnej maszynie
Podstawowe operacje
- Tworzenie i zarządzanie tabelami Iceberg
- Zapisywanie i odczytywanie danych z tabel Iceberg
- Podstawowe operacje CRUD
Migracja i integracja danych
- Migracja danych z Hive i innych systemów do Iceberg
- Integracja z narzędziami BI
- Migracja przykładowego zbioru danych do Iceberg
Optymalizacja wydajności
- Techniki dostrajania wydajności
- Optymalizacja zapytań i skanowania danych
- Optymalizacja wydajności w Iceberg
Przegląd zaawansowanych funkcji
- Ewolucja partycjonowania i ukryte partycjonowanie
- Ewolucja tabel i zmiany schematów
- Podróż w czasie i funkcje cofania zmian
- Implementacja zaawansowanych funkcji w Iceberg
Podsumowanie i kolejne kroki
Wymagania
- Znajomość pojęć takich jak tabele, schematy, partycjonowanie i pozyskiwanie danych
- Podstawowa znajomość SQL
Odbiorcy
- Inżynierowie danych
- Architekci danych
- Analitycy danych
- Programiści
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Fakt, że mogliśmy zabrać ze sobą większość informacji/kursu/prezentacji/zadań, które wykonaliśmy, dzięki czemu możemy się nimi przyjrzeć i ewentualnie powtórzyć to, co nie zrozumieliśmy od razu, lub poprawić to, co już zrobiliśmy.
Raul Mihail Rat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Dostateczna praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o strumieniowaniu Spark, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję