Plan Szkolenia

Podstawy magazynowania danych

  • Cele, składniki i architektura magazynu
  • Data marts, przedsiębiorcze magazyny danych i wzorce lakehouse
  • Podstawy OLTP vs OLAP i oddzielenie obciążenia

Modelowanie wymiarowe

  • Fakty, wymiary i ziarnistość
  • Schema gwiaździsta vs schema śnieżki
  • Typy i obsługa powoli zmiennych wymiarów

Procesy ETL i ELT

  • Strategie ekstrakcji z OLTP i API
  • Transformacje, oczyszczanie danych i zgodność
  • Wzorce ładowania, orchestrowanie i zarządzanie zależnościami

Jakość danych i zarządzanie metadanymi

  • Profilowanie danych i reguły walidacji
  • Wyrównywanie master danych i danych referencyjnych
  • Linia genealogii, katalogi i dokumentacja

Analizy i wydajność

  • Pojęcia kubowania, agregaty i widoki materializowane
  • Podział, klastryzacja i indeksowanie dla analiz
  • Zarządzanie obciążeniem, buforowanie i optymalizacja zapytania

Bezpieczeństwo i zarządzanie

  • Kontrola dostępu, role i bezpieczeństwo na poziomie wierszy
  • Rozważania dotyczące zgodności i audyt
  • Praktyki backupu, odzyskiwania i niezawodności

Współczesne architektury

  • Chmurowe magazyny danych i elastyczność
  • Strumieniowe wchłanianie i analiza w czasie prawie rzeczywistym
  • Optymalizacja kosztów i monitorowanie

Kulminacja: Od źródła do schematu gwiaździstego

  • Modelowanie procesu biznesowego w fakty i wymiary
  • Budowanie końcowego do końca przepływu ETL lub ELT
  • Publikowanie dashboardów i walidacja metryk

Podsumowanie i następne kroki

Wymagania

  • Zrozumienie baz danych relacyjnych i SQL
  • Doświadczenie w analizie danych lub raportowaniu
  • Podstawowa znajomość platform danych w chmurze lub na miejscu

Grupa docelowa

  • Specjaliści ds. analizy danych przechodzący do data warehousing
  • Programiści BI i inżynierowie ETL
  • Archiwistowie danych i liderzy zespołów
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie