Plan Szkolenia
Wprowadzenie do Apache Iceberg
- Przegląd Apache Iceberg
- Omówienie podstawowych pojęć
Szczegółowe badanie architektury Iceberg
- Szczegółowa analiza formatu tabel Iceberg
- Szczegółowy przegląd architektury, w tym metadanych i układu plików
- Wewnętrzna budowa ewolucji schematów i partycji
Zaawansowane instalowanie i konfigurowanie
- Konfigurowanie Iceberg dla optymalnej wydajności w różnych środowiskach
- Integracja z różnymi silnikami przetwarzania danych
- Zaawansowane ustawienia: bezpieczeństwo, szyfrowanie i kontrola dostępu
- Ustawianie Iceberg w środowisku rozproszonym
Zaawansowane operacje i konserwacja
- Zarządzanie dużymi tabelami Iceberg
- Wdrażanie i zarządzanie złożonymi zmianami schematów
- Obsługa ewolucji partycji i ukrytej partycji
- Zaawansowane operacje CRUD ze zmianami schematów i partycji
Techniki optymalizacji zapytań
- Techniki zmniejszania opóźnień zapytań
- Wycinanie partycji i plików
- Pamięć podręczna metadanych i strategie optymalizacji
- Wdrażanie i testowanie technik optymalizacji zapytań
Optymalizacja wydajności dla dużych zbiorów danych
- Optymalizacja wydajności dla dużych zbiorów danych
- Używanie wbudowanych funkcji Iceberg do optymalizacji wydajności
- Studium przypadku optymalizacji wydajności w rzeczywistych scenariuszach
- Dostosowywanie wydajności dla dużych zbiorów danych
Zaawansowana migracja i integracja danych
- Migracja złożonych struktur danych z innych systemów
- Integracja Iceberg z przepływami danych w czasie rzeczywistym
- Migracja złożonych zbiorów danych i integracja przepływów danych w czasie rzeczywistym
Niezawodność i spójność
- Zapewnienie spójności i integralności danych w środowiskach rozproszonych
- Wdrażanie i zarządzanie gwarancjami transakcyjnymi
- Obsługa awarii i mechanizmów odzyskiwania
- Wdrażanie funkcji niezawodności i spójności
Zaawansowane funkcje i dostosowywanie
- Dostosowane implementacje katalogów
- Rozszerzanie Iceberg o niestandardowe funkcje
- Wdrażanie dostosowanych katalogów i rozszerzanie funkcjonalności Iceberg
Zarządzanie danymi i zgodność z przepisami
- Wdrażanie polityk zarządzania danymi
- Zgodność z regulacjami dotyczącymi danych
- Zarządzanie śladami audytu i pochodzeniem danych
- Wdrażanie funkcji zarządzania danymi i zgodności
Podsumowanie i następne kroki
Wymagania
- Zapoznanie się z podstawowymi koncepcjami, podstawowymi operacjami oraz zarządzaniem tabelami Iceberg
Grupa docelowa
- Inżynierowie danych
- Architekci danych
- Analitycy danych
- Programiści
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Przykłady w czasie rzeczywistym
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Wystarczająca praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o Spark Streaming, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję