Plan Szkolenia
Wprowadzenie do Apache Iceberg
- Przegląd Apache Iceberg
- Powtórzenie podstawowych pojęć
Szczegółowe omówienie architektury Iceberg
- Dogłębna analiza formatu tabel Iceberg
- Szczegółowy przegląd architektury, w tym metadanych i układu plików
- Mechanizmy ewolucji schematów i partycji
Zaawansowana instalacja i konfiguracja
- Konfigurowanie Iceberg w celu uzyskania optymalnej wydajności w różnych środowiskach
- Integracja z różnymi silnikami przetwarzania danych
- Zaawansowana konfiguracja: bezpieczeństwo, szyfrowanie i kontrola dostępu
- Konfiguracja Iceberg w środowisku rozproszonym
Zaawansowane operacje i konserwacja
- Zarządzanie tabelami Iceberg na dużą skalę
- Wprowadzanie i zarządzanie złożonymi zmianami schematów
- Zarządzanie ewolucją partycji i ukrytymi partycjami
- Zaawansowane operacje CRUD ze zmianami schematów i partycji
Techniki optymalizacji zapytań
- Techniki redukcji opóźnień zapytań
- Przycinanie partycji i plików
- Strategie buforowania i optymalizacji metadanych
- Wdrażanie i testowanie technik optymalizacji zapytań
Dostrajanie wydajności dla dużych zbiorów danych
- Optymalizacja wydajności dla dużych zbiorów danych
- Wykorzystanie wbudowanych funkcji Iceberg do dostrajania wydajności
- Studia przypadków dotyczące dostrajania wydajności w rzeczywistych scenariuszach
- Dostrajanie wydajności dla dużych zbiorów danych
Zaawansowana migracja i integracja danych
- Migracja złożonych struktur danych z innych systemów
- Integracja Iceberg z strumieniami danych w czasie rzeczywistym
- Migracja złożonych zbiorów danych i integracja strumieni danych w czasie rzeczywistym
Niezawodność i spójność
- Zapewnianie spójności i integralności danych w środowiskach rozproszonych
- Wdrażanie i zarządzanie gwarancjami transakcyjnymi
- Obsługa awarii i mechanizmy odzyskiwania
- Wdrażanie funkcji niezawodności i spójności
Zaawansowane funkcje i dostosowywanie
- Implementacja niestandardowych katalogów
- Rozszerzanie Iceberg o niestandardowe funkcje
- Implementacja niestandardowego katalogu i rozszerzanie funkcjonalności Iceberg
Zarządzanie danymi i zgodność
- Wdrażanie polityk zarządzania danymi
- Zgodność z przepisami dotyczącymi danych
- Zarządzanie śladami audytu i linią danych
- Wdrażanie funkcji zarządzania i zgodności
Podsumowanie i kolejne kroki
Wymagania
- Znajomość podstawowych pojęć, operacji i zarządzania tabelami Iceberg
Grupa docelowa
- Inżynierowie danych
- Architekci danych
- Analitycy danych
- Programiści
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Fakt, że mogliśmy zabrać ze sobą większość informacji/kursu/prezentacji/zadań, które wykonaliśmy, dzięki czemu możemy się nimi przyjrzeć i ewentualnie powtórzyć to, co nie zrozumieliśmy od razu, lub poprawić to, co już zrobiliśmy.
Raul Mihail Rat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Dostateczna praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o strumieniowaniu Spark, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję