Plan Szkolenia
Wprowadzenie do Apache Iceberg
- Przegląd Apache Iceberg
- Znaczenie i przypadki użycia w nowoczesnej architekturze danych
- Kluczowe funkcje i korzyści
Podstawowe pojęcia
- Format tabel Iceberg i architektura
- Porównanie z innymi formatami tabel
- Podział na partie i ewolucja schematu
- Podróż w czasie i wersjonowanie danych
Konfiguracja Apache Iceberg
- Instalacja i konfiguracja
- Integracja Iceberg z różnymi silnikami przetwarzania danych
- Uruchomienie środowiska Iceberg na lokalnej maszynie
Podstawowe operacje
- Tworzenie i zarządzanie tabelami Iceberg
- Pisanie do tabel Iceberg i odczyt z nich
- Podstawowe operacje CRUD
Migracja i integracja danych
- Migracja danych z Hive i innych systemów do Iceberg
- Integracja z narzędziami BI
- Migracja przykładowego zestawu danych do Iceberg
Optymalizacja wydajności
- Techniki optymalizacji wydajności
- Optymalizacja zapytań i skanowania danych
- Optymalizacja wydajności w Iceberg
Przegląd zaawansowanych funkcji
- Ewolucja podziału na partie i ukryty podział na partie
- Ewolucja tabeli i zmiany schematu
- Funkcje podróży w czasie i cofania
- Implementacja zaawansowanych funkcji w Iceberg
Podsumowanie i kolejne kroki
Wymagania
- Znajomość pojęć takich jak tabele, schematy, podział na partie i pobieranie danych
- Podstawowa wiedza o SQL
Grupa docelowa
- Inżynierowie danych
- Architekci danych
- Analitycy danych
- Programiści
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Przykłady w czasie rzeczywistym
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Wystarczająca praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o Spark Streaming, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję