Plan Szkolenia

Wprowadzenie

  • Zrozumienie znaczenia przygotowania danych w analizie i uczeniu maszynowym
  • Rura przygotowania danych i jej rola w cyklu życia danych
  • Badanie typowych wyzwań związanych z surowymi danymi i ich wpływ na analizę

Zbieranie i pozyskiwanie danych

  • Źródła danych: bazy danych, API, arkusze kalkulacyjne, pliki tekstowe i inne
  • Techniki pozyskiwania danych i zapewniania jakości danych podczas ich zbierania
  • Zbieranie danych z różnych źródeł

Data Cleaning Techniki

  • Wykrywanie i obsługa braków, wartości odchylających i niezgodności
  • Radzenie sobie z duplikatami i błędami w zbiorze danych
  • Czyszczenie rzeczywistych zbiorów danych

Transformacja i standaryzacja danych

  • Techniki normalizacji i standaryzacji danych
  • Obsługa danych kategorycznych: kodowanie, binowanie i inżynieria cech
  • Przekształcanie surowych danych w użyteczne formaty

Data Integration i agregacja

  • Łączenie i kombinowanie zbiorów danych z różnych źródeł
  • Rozwiązywanie konfliktów danych i wyrównywanie typów danych
  • Techniki agregacji i konsolidacji danych

Data Quality Zapewnienie

  • Metody zapewnienia jakości i integralności danych przez cały proces
  • Wdrażanie procedur sprawdzania jakości i walidacji
  • Przykłady i praktyczne zastosowania zapewniania jakości danych

Redukcja wymiarowości i wybór cech

  • Zrozumienie potrzeby redukcji wymiarowości
  • Techniki takie jak PCA, selekcja cech i strategie redukcji
  • Wdrażanie technik redukcji wymiarowości

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowa znajomość pojęć dotyczących danych

Uczestnicy

  • Analitycy danych
  • Database administratorzy
  • Specjaliści IT
 14 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (4)

Propozycje terminów

Powiązane Kategorie