Plan Szkolenia
Wprowadzenie do Apache Iceberg
- Przegląd Apache Iceberg
- Znaczenie i przypadki użycia w nowoczesnej architekturze danych
- Kluczowe funkcje i korzyści
Podstawowe pojęcia
- Format tabel Iceberg i architektura
- Porównanie z innymi formatami tabel
- Podział na partie i ewolucja schematu
- Podróż w czasie i wersjonowanie danych
Konfiguracja Apache Iceberg
- Instalacja i konfiguracja
- Integracja Iceberg z różnymi silnikami przetwarzania danych
- Uruchomienie środowiska Iceberg na lokalnej maszynie
Podstawowe operacje
- Tworzenie i zarządzanie tabelami Iceberg
- Pisanie do tabel Iceberg i odczyt z nich
- Podstawowe operacje CRUD
Migracja i integracja danych
- Migracja danych z Hive i innych systemów do Iceberg
- Integracja z narzędziami BI
- Migracja przykładowego zestawu danych do Iceberg
Optymalizacja wydajności
- Techniki optymalizacji wydajności
- Optymalizacja zapytań i skanowania danych
- Optymalizacja wydajności w Iceberg
Przegląd zaawansowanych funkcji
- Ewolucja podziału na partie i ukryty podział na partie
- Ewolucja tabeli i zmiany schematu
- Funkcje podróży w czasie i cofania
- Implementacja zaawansowanych funkcji w Iceberg
Podsumowanie i kolejne kroki
Wymagania
- Znajomość pojęć takich jak tabele, schematy, podział na partie i pobieranie danych
- Podstawowa wiedza o SQL
Grupa docelowa
- Inżynierowie danych
- Architekci danych
- Analitycy danych
- Programiści
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
The live examples
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift