Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie
- Zrozumienie znaczenia przygotowania danych w analityce i uczeniu maszynowym
- Potok przygotowania danych i jego rola w cyklu życia danych
- Eksploracja typowych wyzwań związanych z surowymi danymi i ich wpływ na analizę
Zbieranie i pozyskiwanie danych
- Źródła danych: bazy danych, API, arkusze kalkulacyjne, pliki tekstowe i inne
- Techniki zbierania danych i zapewniania ich jakości podczas zbierania
- Zbieranie danych z różnych źródeł
Techniki czyszczenia danych
- Identyfikowanie i obsługa brakujących wartości, wartości odstających i niespójności
- Radzenie sobie z duplikatami i błędami w zbiorze danych
- Czyszczenie rzeczywistych zbiorów danych
Transformacja i standaryzacja danych
- Techniki normalizacji i standaryzacji danych
- Obsługa danych kategorycznych: kodowanie, grupowanie i inżynieria cech
- Przekształcanie surowych danych w użyteczne formaty
Integracja i agregacja danych
- Łączenie i scalanie zbiorów danych z różnych źródeł
- Rozwiązywanie konfliktów danych i dostosowywanie typów danych
- Techniki agregacji i konsolidacji danych
Zapewnienie jakości danych
- Metody zapewniania jakości i integralności danych w całym procesie
- Implementowanie kontroli jakości i procedur walidacji
- Studia przypadków i praktyczne zastosowania zapewniania jakości danych
Redukcja wymiarowości i selekcja cech
- Zrozumienie potrzeby redukcji wymiarowości
- Techniki takie jak PCA, selekcja cech i strategie redukcji
- Implementowanie technik redukcji wymiarowości
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa znajomość koncepcji danych
Grupa docelowa
- Analitycy danych
- Administratorzy baz danych
- Profesjonaliści IT
14 godzin
Opinie uczestników (4)
duzo interakcji z trenerem
Emilia - ATOS PGS sp. z o.o.
Szkolenie - RODO / GDPR - zmiany prawne, wprowadzenie teoretyczne, praktyczne aspekty
wiedza, wzorcowe prowadzenie szkolenia
Krzysztof Kantorski - Santander
Szkolenie - Oracle GoldenGate
Różnorodność udostępnianych informacji oraz jasność wyjaśniania terminów w zrozumiały sposób.
Arisbe Mendoza - Fairtrade International
Szkolenie - GDPR Workshop
Przetłumaczone przez sztuczną inteligencję
To jest sesja praktyczna.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Szkolenie - Talend Open Studio for ESB
Przetłumaczone przez sztuczną inteligencję