Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie

  • Zrozumienie znaczenia przygotowania danych w analityce i uczeniu maszynowym
  • Potok przygotowania danych i jego rola w cyklu życia danych
  • Eksploracja typowych wyzwań związanych z surowymi danymi i ich wpływ na analizę

Zbieranie i pozyskiwanie danych

  • Źródła danych: bazy danych, API, arkusze kalkulacyjne, pliki tekstowe i inne
  • Techniki zbierania danych i zapewniania ich jakości podczas zbierania
  • Zbieranie danych z różnych źródeł

Techniki czyszczenia danych

  • Identyfikowanie i obsługa brakujących wartości, wartości odstających i niespójności
  • Radzenie sobie z duplikatami i błędami w zbiorze danych
  • Czyszczenie rzeczywistych zbiorów danych

Transformacja i standaryzacja danych

  • Techniki normalizacji i standaryzacji danych
  • Obsługa danych kategorycznych: kodowanie, grupowanie i inżynieria cech
  • Przekształcanie surowych danych w użyteczne formaty

Integracja i agregacja danych

  • Łączenie i scalanie zbiorów danych z różnych źródeł
  • Rozwiązywanie konfliktów danych i dostosowywanie typów danych
  • Techniki agregacji i konsolidacji danych

Zapewnienie jakości danych

  • Metody zapewniania jakości i integralności danych w całym procesie
  • Implementowanie kontroli jakości i procedur walidacji
  • Studia przypadków i praktyczne zastosowania zapewniania jakości danych

Redukcja wymiarowości i selekcja cech

  • Zrozumienie potrzeby redukcji wymiarowości
  • Techniki takie jak PCA, selekcja cech i strategie redukcji
  • Implementowanie technik redukcji wymiarowości

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowa znajomość koncepcji danych

Grupa docelowa

  • Analitycy danych
  • Administratorzy baz danych
  • Profesjonaliści IT
 14 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (4)

Propozycje terminów

Powiązane Kategorie