Plan Szkolenia

Wprowadzenie do Teradata

Moduł 1: Podstawy Teradata i jej architektury

  • Co to jest Teradata i do czego służy?
  • Architektura równoległa: AMPs, PEs, BYNET
  • Rozdzielanie danych i hashowanie
  • Kluczowe pojęcia: sesje, spool, zamki
  • Połączenie z systemem: Teradata Studio / BTEQ / SQL Assistant

Moduł 2: Wprowadzenie do SQL w Teradata

  • Podstawowe SELECT, WHERE, ORDER BY
  • Typy danych i rzutowanie
  • Funkcje matematyczne i datowe
  • Użycie ALIAS, wyrażeń CASE
  • Specjalne operatory Teradata (TOP, QUALIFY, SAMPLE)
  • Praktyka z konsultacji na podstawie rzeczywistych tabel

Moduł 3: Połączenia, podzapytania i operatory zbiorów

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Połączenia bez klauzuli ON (iloczyn kartezjański)
  • Skalarne podzapytania i korelowane
  • UNION, INTERSECT, MINUS
  • Ćwiczenia praktyczne z integracją danych

Moduł 4: Funkcje analityczne i OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Podział danych z PARTITION BY
  • Okna z OVER() i ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Przykłady zastosowań: KPI, trendy, wartości kumulatywne

Moduł 5: Zarządzanie danymi i tabelami

  • Typy tabel: stałe, czasowe, globalnie czasowe
  • Tworzenie i używanie sekundarnych indeksów i indeksów łączenia
  • Wstawianie, aktualizowanie i usuwanie rekordów
  • MERGE, UPSERT i kontrola duplikatów
  • Transakcje i kontrola zamków

Moduł 6: Optymalizacja i dostrajanie wydajności

  • Optimizer Teradata: jak wybiera plany
  • Używanie EXPLAIN i COLLECT STATISTICS
  • Skos i jak go unikać
  • Najlepsze praktyki w projektowaniu zapytania
  • Identyfikacja wąskich gardzieli (spool, zamki, redystrybucja)
  • Praktyka: porównanie między optymalizowanymi a nieoptymalizowanymi zapytaniami

Moduł 7: Podział i kompresja danych

  • Typy podziału: Range, Case, Multi-Level
  • Korzyści i praktyczne zastosowanie w dużych zapytaniach
  • Block Level Compression (BLC) i Columnar Compression
  • Zalety i ograniczenia

Moduł 8: Ładowanie i ekstrakcja danych

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Ładowanie masowe vs. wstawianie partiami
  • Obsługa błędów i powtórne próby
  • Eksportowanie wyników do plików lub zewnętrznych systemów
  • Podstawowa automatyzacja za pomocą skryptów i narzędzi

Moduł 9: Podstawowa administracja dla użytkowników technicznych

  • Role i uprawnienia
  • Kontrola zasobów (Query Bands, Priority Scheduler)
  • Monitoring z DBQLOGTBL, DBC.Tables, ResUsage
  • Dobre praktyki dla środowisk wspólnych

Moduł 10: Końcowe laboratorium integracyjne

  • Przypadek praktyczny od początku do końca:
    • Ładowanie danych
    • Transformacja i agregacja
    • Budowanie wskaźników z funkcjami OLAP
    • Optymalizacja i wyjaśnienie
    • Końcowy eksport
  • Dyskusja nad dobrymi praktykami i częstymi błędami

Wymagania

  • Zrozumienie baz danych relacyjnych i pojęć SQL
  • Doświadczenie w zapytywaniu dużych zbiorów danych lub pracy w środowiskach danych
  • Zapoznanie z celami analityki biznesowej lub analiz

Grupa docelowa

  • Analitycy danych i specjaliści ds. biznesowej analityki
  • SQL developers i inżynierowie danych
  • Użytkownicy techniczni zarządzający lub optymalizujący dane w środowiskach Teradata
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie