Plan Szkolenia
Podstawy magazynowania danych
- Cele, składniki i architektura magazynu
- Data marts, przedsiębiorcze magazyny danych i wzorce lakehouse
- Podstawy OLTP vs OLAP i oddzielenie obciążenia
Modelowanie wymiarowe
- Fakty, wymiary i ziarnistość
- Schema gwiaździsta vs schema śnieżki
- Typy i obsługa powoli zmiennych wymiarów
Procesy ETL i ELT
- Strategie ekstrakcji z OLTP i API
- Transformacje, oczyszczanie danych i zgodność
- Wzorce ładowania, orchestrowanie i zarządzanie zależnościami
Jakość danych i zarządzanie metadanymi
- Profilowanie danych i reguły walidacji
- Wyrównywanie master danych i danych referencyjnych
- Linia genealogii, katalogi i dokumentacja
Analizy i wydajność
- Pojęcia kubowania, agregaty i widoki materializowane
- Podział, klastryzacja i indeksowanie dla analiz
- Zarządzanie obciążeniem, buforowanie i optymalizacja zapytania
Bezpieczeństwo i zarządzanie
- Kontrola dostępu, role i bezpieczeństwo na poziomie wierszy
- Rozważania dotyczące zgodności i audyt
- Praktyki backupu, odzyskiwania i niezawodności
Współczesne architektury
- Chmurowe magazyny danych i elastyczność
- Strumieniowe wchłanianie i analiza w czasie prawie rzeczywistym
- Optymalizacja kosztów i monitorowanie
Kulminacja: Od źródła do schematu gwiaździstego
- Modelowanie procesu biznesowego w fakty i wymiary
- Budowanie końcowego do końca przepływu ETL lub ELT
- Publikowanie dashboardów i walidacja metryk
Podsumowanie i następne kroki
Wymagania
- Zrozumienie baz danych relacyjnych i SQL
- Doświadczenie w analizie danych lub raportowaniu
- Podstawowa znajomość platform danych w chmurze lub na miejscu
Grupa docelowa
- Specjaliści ds. analizy danych przechodzący do data warehousing
- Programiści BI i inżynierowie ETL
- Archiwistowie danych i liderzy zespołów
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Przykłady w czasie rzeczywistym
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Wystarczająca praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o Spark Streaming, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję