Plan Szkolenia

Wprowadzenie do Teradata

Moduł 1: Podstawy i architektura Teradata

  • Co to jest Teradata i do czego służy?
  • Architektura równoległa: AMPs, PEs, BYNET
  • Rozmieszczanie danych i hashowanie
  • Kluczowe koncepcje: sesje, spółka, bloki
  • Połączenie z systemem: Teradata Studio / BTEQ / SQL Assistant

Moduł 2: Wprowadzenie do SQL w Teradata

  • Podstawowe SELECT, WHERE, ORDER BY
  • Typy danych i rzutowanie
  • Funkcje matematyczne i datowe
  • Używanie ALIAS, wyrażeń CASE
  • Teradata-specyficzne operatory (TOP, QUALIFY, SAMPLE)
  • Praktyczne ćwiczenia: zapytania na rzeczywistych tabelach

Moduł 3: Łączenia, podzapytania i operatory zbiorów

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Łączenia bez klauzuli ON (iloczyn kartezjański)
  • Skalarne i skorelowane podzapytania
  • UNION, INTERSECT, MINUS
  • Praktyczne ćwiczenia na integracji danych

Moduł 4: Analityczne i OLAP funkcje

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Podział danych z PARTITION BY
  • Okienkowanie z OVER() i ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Przykłady zastosowań: KPI, trendy, wartości kumulacyjne

Moduł 5: Zarządzanie danymi i tabelami Management

  • Typy tabel: stałe, niestałe, globalne tymczasowe
  • Tworzenie i używanie wskaźników sekundarnych i łączeniowych
  • Operacje insert, update i delete
  • MERGE, UPSERT i kontrola duplikatów
  • Transakcje i kontrola blokowania

Moduł 6: Optymalizacja i dostrajanie wydajności

  • Teradata Optimizer: jak wybiera plany wykonania
  • Używanie EXPLAIN i COLLECT STATISTICS
  • Nierównowaga i jak jej uniknąć
  • Najlepsze praktyki w projektowaniu zapytań
  • Identyfikacja wąskich gardeł (spółka, bloki, redystrybucja)
  • Praktyka: porównanie zoptymalizowanych i niezoptymalizowanych zapytań

Moduł 7: Podział danych i kompresja

  • Typy podziałów: Range, Case, Multi-Level
  • Korzyści i praktyczne zastosowanie w dużych zapytaniach
  • Kompresja na poziomie bloku (BLC) i kompresja kolumnowa
  • Zalety i ograniczenia

Moduł 8: Wczytywanie i ekstrakcja danych

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Wczytywanie masowe vs. wstawianie partiami
  • Obsługa błędów i powtórzenia
  • Eksportowanie wyników do plików lub zewnętrznych systemów
  • Podstawowa automatyzacja za pomocą skryptów i narzędzi

Moduł 9: Podstawowa administracja dla użytkowników technicznych

  • Role i uprawnienia
  • Kontrola zasobów (Query Bands, Priority Scheduler)
  • Monitorowanie za pomocą DBQLOGTBL, DBC.Tables, ResUsage
  • Najlepsze praktyki dla współdzielonych środowisk

Moduł 10: Ostateczne laboratorium integracyjne

  • Praktyczny przypadek od początku do końca:
  • Wczytywanie danych
  • Transformacja i agregacja
  • Budowanie KPI z funkcjami OLAP
  • Optymalizacja i EXPLAIN
  • Ostateczny eksport
  • Dyskusja najlepszych praktyk i typowych błędów

Podsumowanie i kolejne kroki

Wymagania

  • Zrozumienie baz danych relacyjnych i pojęć SQL
  • Doświadczenie w zapytywaniu dużych zbiorów danych lub pracy w środowiskach danych
  • Zapoznanie z celami analityki biznesowej lub analiz

Grupa docelowa

  • Analitycy danych i specjaliści ds. biznesowej analityki
  • SQL developers i inżynierowie danych
  • Użytkownicy techniczni zarządzający lub optymalizujący dane w środowiskach Teradata
 35 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie