Plan Szkolenia

Podstawy przechowywania danych

  • Cel, komponenty i architektura hurtowni danych
  • Marts danych, hurtownie przedsiębiorstw i wzorce lakehouse
  • Podstawy OLTP vs OLAP oraz separacja obciążeń

Modelowanie wymiarowe

  • Fakty, wymiary i ziarno
  • Schemat gwiazdy vs schemat płatka śniegu
  • Typy i zarządzanie powoli zmieniającymi się wymiarami

Procesy ETL i ELT

  • Strategie ekstrakcji z OLTP i API
  • Transformacje, czyszczenie danych i zgodność
  • Wzorce ładowania, orkiestracja i zarządzanie zależnościami

Jakość danych i zarządzanie metadanymi

  • Profilowanie danych i reguły walidacji
  • Dopasowanie danych głównych i referencyjnych
  • Linia pochodzenia, katalogi i dokumentacja

Analizy i wydajność

  • Koncepcje kostek, agregaty i materializowane widoki
  • Partycjonowanie, klasteryzacja i indeksowanie dla analiz
  • Zarządzanie obciążeniami, buforowanie i optymalizacja zapytań

Bezpieczeństwo i zarządzanie

  • Kontrola dostępu, role i bezpieczeństwo na poziomie wierszy
  • Zagadnienia zgodności i audytowanie
  • Praktyki dotyczące kopii zapasowych, odzyskiwania i niezawodności

Nowoczesne architektury

  • Chmurowe hurtownie danych i elastyczność
  • Przetwarzanie strumieniowe i analizy w czasie niemal rzeczywistym
  • Optymalizacja kosztów i monitorowanie

Projekt końcowy: Od źródła do schematu gwiazdy

  • Modelowanie procesu biznesowego na fakty i wymiary
  • Budowanie kompleksowego przepływu pracy ETL lub ELT
  • Publikowanie pulpitów nawigacyjnych i walidacja metryk

Podsumowanie i kolejne kroki

Wymagania

  • Znajomość baz danych relacyjnych i języka SQL
  • Doświadczenie w analizie danych lub raportowaniu
  • Podstawowa znajomość platform danych w chmurze lub lokalnie

Grupa docelowa

  • Analitycy danych przechodzący do obszaru przechowywania danych
  • Deweloperzy BI i inżynierowie ETL
  • Architekci danych i liderzy zespołów
 35 godzin

Liczba uczestników


Cena za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie