Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Podstawy przechowywania danych
- Cel, komponenty i architektura hurtowni danych
- Marts danych, hurtownie przedsiębiorstw i wzorce lakehouse
- Podstawy OLTP vs OLAP oraz separacja obciążeń
Modelowanie wymiarowe
- Fakty, wymiary i ziarno
- Schemat gwiazdy vs schemat płatka śniegu
- Typy i zarządzanie powoli zmieniającymi się wymiarami
Procesy ETL i ELT
- Strategie ekstrakcji z OLTP i API
- Transformacje, czyszczenie danych i zgodność
- Wzorce ładowania, orkiestracja i zarządzanie zależnościami
Jakość danych i zarządzanie metadanymi
- Profilowanie danych i reguły walidacji
- Dopasowanie danych głównych i referencyjnych
- Linia pochodzenia, katalogi i dokumentacja
Analizy i wydajność
- Koncepcje kostek, agregaty i materializowane widoki
- Partycjonowanie, klasteryzacja i indeksowanie dla analiz
- Zarządzanie obciążeniami, buforowanie i optymalizacja zapytań
Bezpieczeństwo i zarządzanie
- Kontrola dostępu, role i bezpieczeństwo na poziomie wierszy
- Zagadnienia zgodności i audytowanie
- Praktyki dotyczące kopii zapasowych, odzyskiwania i niezawodności
Nowoczesne architektury
- Chmurowe hurtownie danych i elastyczność
- Przetwarzanie strumieniowe i analizy w czasie niemal rzeczywistym
- Optymalizacja kosztów i monitorowanie
Projekt końcowy: Od źródła do schematu gwiazdy
- Modelowanie procesu biznesowego na fakty i wymiary
- Budowanie kompleksowego przepływu pracy ETL lub ELT
- Publikowanie pulpitów nawigacyjnych i walidacja metryk
Podsumowanie i kolejne kroki
Wymagania
- Znajomość baz danych relacyjnych i języka SQL
- Doświadczenie w analizie danych lub raportowaniu
- Podstawowa znajomość platform danych w chmurze lub lokalnie
Grupa docelowa
- Analitycy danych przechodzący do obszaru przechowywania danych
- Deweloperzy BI i inżynierowie ETL
- Architekci danych i liderzy zespołów
35 godzin
Opinie uczestników (2)
ankieta przed szkoleniem i zastosowanie jej wynikow.
Krzysztof - Alfa Laval
Szkolenie - Python and Spark for Big Data (PySpark)
Zaangażowanie i chęć wyjaśnienia tematów pobocznych.