Plan Szkolenia
Podstawy przechowywania danych
- Cel, komponenty i architektura hurtowni danych
- Marts danych, hurtownie przedsiębiorstw i wzorce lakehouse
- Podstawy OLTP vs OLAP oraz separacja obciążeń
Modelowanie wymiarowe
- Fakty, wymiary i ziarno
- Schemat gwiazdy vs schemat płatka śniegu
- Typy i zarządzanie powoli zmieniającymi się wymiarami
Procesy ETL i ELT
- Strategie ekstrakcji z OLTP i API
- Transformacje, czyszczenie danych i zgodność
- Wzorce ładowania, orkiestracja i zarządzanie zależnościami
Jakość danych i zarządzanie metadanymi
- Profilowanie danych i reguły walidacji
- Dopasowanie danych głównych i referencyjnych
- Linia pochodzenia, katalogi i dokumentacja
Analizy i wydajność
- Koncepcje kostek, agregaty i materializowane widoki
- Partycjonowanie, klasteryzacja i indeksowanie dla analiz
- Zarządzanie obciążeniami, buforowanie i optymalizacja zapytań
Bezpieczeństwo i zarządzanie
- Kontrola dostępu, role i bezpieczeństwo na poziomie wierszy
- Zagadnienia zgodności i audytowanie
- Praktyki dotyczące kopii zapasowych, odzyskiwania i niezawodności
Nowoczesne architektury
- Chmurowe hurtownie danych i elastyczność
- Przetwarzanie strumieniowe i analizy w czasie niemal rzeczywistym
- Optymalizacja kosztów i monitorowanie
Projekt końcowy: Od źródła do schematu gwiazdy
- Modelowanie procesu biznesowego na fakty i wymiary
- Budowanie kompleksowego przepływu pracy ETL lub ELT
- Publikowanie pulpitów nawigacyjnych i walidacja metryk
Podsumowanie i kolejne kroki
Wymagania
- Znajomość baz danych relacyjnych i języka SQL
- Doświadczenie w analizie danych lub raportowaniu
- Podstawowa znajomość platform danych w chmurze lub lokalnie
Grupa docelowa
- Analitycy danych przechodzący do obszaru przechowywania danych
- Deweloperzy BI i inżynierowie ETL
- Architekci danych i liderzy zespołów
Opinie uczestników (5)
Doświadczenie praktyczne trenera, nie koloryzowanie omawianego rozwiązania ale też nie wprowadzanie negatywnego nacechowania. Mam poczucie, że trener przygotowuje mnie do realnego i praktycznego wykorzystania narzędzia - tych cennych szczegółów nie ma zazwyczaj w książkach.
Krzysztof Miodek - Krajowy Rejestr Dlugow Biuro Informacji Gospodarczej S.A.
Szkolenie - Apache Spark Fundamentals
Żywe przykłady
Ahmet Bolat - Accenture Industrial SS
Szkolenie - Python, Spark, and Hadoop for Big Data
Przetłumaczone przez sztuczną inteligencję
bardzo interaktywny...
Richard Langford
Szkolenie - SMACK Stack for Data Science
Przetłumaczone przez sztuczną inteligencję
Dostateczna praktyka, trener jest kompetentny
Chris Tan
Szkolenie - A Practical Introduction to Stream Processing
Przetłumaczone przez sztuczną inteligencję
Dowiedz się o strumieniowaniu Spark, Databricks i AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Szkolenie - Apache Spark in the Cloud
Przetłumaczone przez sztuczną inteligencję