Plan Szkolenia
Wprowadzenie do Teradata
Moduł 1: Podstawy Teradata i jej architektura
- Co to jest Teradata i do czego służy?
- Równoległa architektura: AMPs, PEs, BYNET
- Dystrybucja danych i haszowanie
- Kluczowe pojęcia: sesje, spool, blokady (locks)
- Połączenie z systemem: Teradata Studio / BTEQ / SQL Assistant
Moduł 2: Wprowadzenie do SQL w Teradata
- Podstawowe zapytanie SELECT, WHERE, ORDER BY
- Typy danych i rzutowanie (casting)
- Funkcje matematyczne i datowe
- Użycie ALIAS, wyrażenia CASE
- Specjalne operatory Teradata (TOP, QUALIFY, SAMPLE)
- Praktyczna sesja: zapytania na rzeczywistych tabelach
Moduł 3: Joiny, podzapytania i operatory zbiorów (Set Operators)
- INNER, LEFT, RIGHT, FULL OUTER JOIN
- Joiny bez klauzuli ON (produkt kartezjański)
- Skalary i korelacyjne podzapytania
- UNION, INTERSECT, MINUS
- Ćwiczenia praktyczne integracji danych
Moduł 4: Funkcje analityczne i OLAP
- RANK(), ROW_NUMBER(), DENSE_RANK()
- Partycjonowanie danych z PARTITION BY
- Okna z OVER() i ORDER BY
- LAG(), LEAD(), FIRST_VALUE()
- Przypadki użycia: KPI, trendy, sumy częściowe
Moduł 5: Zarządzanie danymi i tabelami
- Typy tabel: trwałe, nieustalone (volatile), globalnie czasowe
- Tworzenie i użycie drugorzędnych indeksów i join indexes
- Wstawianie, aktualizowanie i usuwanie rekordów
- MERGE, UPSERT i kontrola duplikatów
- Transakcje i kontrola blokad (locks)
Moduł 6: Optymalizacja i dostosowywanie wydajności (Performance Tuning)
- Optymalizator Teradata: jak decyduje o planach
- Użycie EXPLAIN i COLLECT STATISTICS
- Skew i jak go unikać
- Najlepsze praktyki projektowania zapytań
- Identyfikacja gardeł butelkowych (spool, blokady, redistribucja)
- Praktyka: porównanie zoptymalizowanych zapytań z niezoptymalizowanymi
Moduł 7: Partycjonowanie i kompresja danych
- Typy partycjonowania: zakresowe (Range), warunkowe (Case), wielopoziomowe (Multi-Level)
- Korzyści i praktyczne zastosowanie w dużych zapytaniach
- Kompresja na poziomie bloków (BLC) i kompresja kolumnowa
- Zalety i ograniczenia
Moduł 8: Ładowanie i wyodrębnianie danych
- TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
- Ładowanie masowe vs. ładowanie partiami
- Obsługa błędów i ponowienia
- Eksport wyników do plików lub systemów zewnętrznych
- Podstawowa automatyzacja za pomocą skryptów i narzędzi
Moduł 9: Podstawowe zarządzanie dla użytkowników technicznych
- Role i uprawnienia
- Kontrola zasobów (Query Bands, Priority Scheduler)
- Monitorowanie za pomocą DBQLOGTBL, DBC.Tables, ResUsage
- Najlepsze praktyki dla środowisk udostępnionych
Moduł 10: Końcowe laboratorium integracji
-
Praktyczny przypadek od początku do końca:
- Ładowanie danych
- Transformacja i agregacja
- Budowanie wskaźników za pomocą funkcji OLAP
- Optymalizacja i wyjaśnienie
- Końcowy eksport
- Dyskusja o najlepszych praktykach i częstych błędach
Wymagania
- Zrozumienie relacyjnych baz danych i pojęć SQL
- Doświadczenie w zapytaniach dużych zestawów danych lub pracy w środowiskach danych
- Znajomość celów biznesowej inteligencji lub analizy
Audiencja
- Analitycy danych i profesjonalisci biznesowej inteligencji
- Programiści SQL i inżynierowie danych
- Użytkownicy techniczni zarządzający lub optymalizujący dane w środowiskach Teradata
Opinie uczestników (1)
Nice training, full of interesting topics. After each topic helpful examples were provided.