Plan Szkolenia
Podstawy Data Warehousing
- Cel, komponenty i architektura magazynu danych
- Data Marts, enterprise warehouses i wzory lakehouse
- Podstawy OLTP vs OLAP i oddzielenie obciążenia
Modelowanie Wymiarowe
- Fakty, wymiary i ziarno
- Schemat gwiazdy vs schemat śnieżki
- Typy powoli zmieniających się wymiarów i ich obsługa
Procesy ETL i ELT
- Strategie ekstrakcji z OLTP i API
- Transformacje, czyszczenie danych i konsolidacja
- Wzorce ładowania, orchestracja i zarządzanie zależnościami
Zarządzanie Jakością Danych i Metadane
- Profilowanie danych i reguły walidacji
- Wyrównanie master i referencyjnych danych
- Linia przewodnia, katalogi i dokumentacja
Analiza i Wydajność
- Koncepcje kostek, agregacji i materializowanych widoków
- Partycjonowanie, klastrowanie i indeksowanie dla analizy
- Zarządzanie obciążeniem, buforowanie i optymalizacja zapytań
Bezpieczeństwo i Zarządzanie
- Kontrola dostępu, role i bezpieczeństwo na poziomie wiersza
- Rozważania dotyczące zgodności i audyty
- Przywracanie, odzyskiwanie i praktyki niezawodnościowe
Nowoczesne Architektury
- Chmurowe magazyny danych i elastyczność
- Strumieniowa ingestja i analiza w bliskim czasie rzeczywistym
- Optymalizacja kosztów i monitorowanie
Projekt Zakończeniowy: Od Źródła do Schematu Gwiazdy
- Modelowanie procesu biznesowego na fakty i wymiary
- Budowanie end-to-end potoku ETL lub ELT
- Publikowanie pulpitemu nawigacyjnego i walidacja metryk
Podsumowanie i Kolejne Kroki
Wymagania
- Zrozumienie relacyjnych baz danych i SQL
- Doświadczenie w analizie danych lub raportowaniu
- Podstawowa znajomość chmurowych lub lokalnych platform danych
Odbiorcy
- Analiza danych przechodzące do data warehousing
- Deweloperzy BI i inżynierowie ETL
- Architekci danych i liderzy zespołów
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Przykłady w czasie rzeczywistym
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Wystarczająca praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o Spark Streaming, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję