Plan Szkolenia

Wprowadzenie do Teradata

Moduł 1: Podstawy Teradata i jej architektura

  • Co to jest Teradata i do czego służy?
  • Równoległa architektura: AMPs, PEs, BYNET
  • Dystrybucja danych i haszowanie
  • Kluczowe pojęcia: sesje, spool, blokady (locks)
  • Połączenie z systemem: Teradata Studio / BTEQ / SQL Assistant

Moduł 2: Wprowadzenie do SQL w Teradata

  • Podstawowe zapytanie SELECT, WHERE, ORDER BY
  • Typy danych i rzutowanie (casting)
  • Funkcje matematyczne i datowe
  • Użycie ALIAS, wyrażenia CASE
  • Specjalne operatory Teradata (TOP, QUALIFY, SAMPLE)
  • Praktyczna sesja: zapytania na rzeczywistych tabelach

Moduł 3: Joiny, podzapytania i operatory zbiorów (Set Operators)

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Joiny bez klauzuli ON (produkt kartezjański)
  • Skalary i korelacyjne podzapytania
  • UNION, INTERSECT, MINUS
  • Ćwiczenia praktyczne integracji danych

Moduł 4: Funkcje analityczne i OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Partycjonowanie danych z PARTITION BY
  • Okna z OVER() i ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Przypadki użycia: KPI, trendy, sumy częściowe

Moduł 5: Zarządzanie danymi i tabelami

  • Typy tabel: trwałe, nieustalone (volatile), globalnie czasowe
  • Tworzenie i użycie drugorzędnych indeksów i join indexes
  • Wstawianie, aktualizowanie i usuwanie rekordów
  • MERGE, UPSERT i kontrola duplikatów
  • Transakcje i kontrola blokad (locks)

Moduł 6: Optymalizacja i dostosowywanie wydajności (Performance Tuning)

  • Optymalizator Teradata: jak decyduje o planach
  • Użycie EXPLAIN i COLLECT STATISTICS
  • Skew i jak go unikać
  • Najlepsze praktyki projektowania zapytań
  • Identyfikacja gardeł butelkowych (spool, blokady, redistribucja)
  • Praktyka: porównanie zoptymalizowanych zapytań z niezoptymalizowanymi

Moduł 7: Partycjonowanie i kompresja danych

  • Typy partycjonowania: zakresowe (Range), warunkowe (Case), wielopoziomowe (Multi-Level)
  • Korzyści i praktyczne zastosowanie w dużych zapytaniach
  • Kompresja na poziomie bloków (BLC) i kompresja kolumnowa
  • Zalety i ograniczenia

Moduł 8: Ładowanie i wyodrębnianie danych

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Ładowanie masowe vs. ładowanie partiami
  • Obsługa błędów i ponowienia
  • Eksport wyników do plików lub systemów zewnętrznych
  • Podstawowa automatyzacja za pomocą skryptów i narzędzi

Moduł 9: Podstawowe zarządzanie dla użytkowników technicznych

  • Role i uprawnienia
  • Kontrola zasobów (Query Bands, Priority Scheduler)
  • Monitorowanie za pomocą DBQLOGTBL, DBC.Tables, ResUsage
  • Najlepsze praktyki dla środowisk udostępnionych

Moduł 10: Końcowe laboratorium integracji

  • Praktyczny przypadek od początku do końca:
    • Ładowanie danych
    • Transformacja i agregacja
    • Budowanie wskaźników za pomocą funkcji OLAP
    • Optymalizacja i wyjaśnienie
    • Końcowy eksport
  • Dyskusja o najlepszych praktykach i częstych błędach

Wymagania

  • Zrozumienie relacyjnych baz danych i pojęć SQL
  • Doświadczenie w zapytaniach dużych zestawów danych lub pracy w środowiskach danych
  • Znajomość celów biznesowej inteligencji lub analizy

Audiencja

  • Analitycy danych i profesjonalisci biznesowej inteligencji
  • Programiści SQL i inżynierowie danych
  • Użytkownicy techniczni zarządzający lub optymalizujący dane w środowiskach Teradata
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie