Plan Szkolenia

Machine Learning Wprowadzenie

  • Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
  • Od uczenia statystycznego do uczenia maszynowego
  • Przepływ pracy w data mining: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
  • Wybór odpowiedniego algorytmu dla zadania
  • Przeuczenie i kompromis między uprzedzeniami a warianacją

Python i Przegląd Bibliotek ML

  • Dlaczego używać języków programowania do ML
  • Wybór między R a Python
  • Python kurs podstawowy i Notatniki Jupyter
  • Python biblioteki: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testowanie i Ocena Algorytmów ML

  • Generalizacja, przeuczenie i walidacja modelu
  • Strategie oceny: holdout, walidacja krzyżowa, bootstrapping
  • Miary dla regresji: ME, MSE, RMSE, MAPE
  • Miary dla klasyfikacji: dokładność, macierz błędów, niezbilansowane klasy
  • Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa podnoszenia
  • Wybór modelu i przeszukiwanie siatki do dostrajania

Przygotowanie Danych

  • Import i przechowywanie danych w Python
  • Eksploracyjna analiza i statystyki podsumowujące
  • Obsługa brakujących wartości i wartości odchylających
  • Standaryzacja, normalizacja i transformacja
  • Przekodowanie danych jakościowych i manipulowanie danymi z użyciem pandas

Algorytmy Klasyfikacji

  • Klasyfikacja binarna vs wieloklasowa
  • Regresja logistyczna i funkcje dyskryminacyjne
  • Naïve Bayes, k-najbliższych sąsiadów
  • Drzewa decyzyjne: CART, Random Foresty, Bagging, Boosting, XGBoost
  • Maszyny wektorów nośnych i jądra
  • Techniki uczenia zespołowego

Regresja i Numeryczna Predykcja

  • Metoda najmniejszych kwadratów i wybór zmiennych
  • Metody regularizacji: L1, L2
  • Regresja wielomianowa i niełatwe modele
  • Drzewa regresji i splajny

Unsupervised Learning

  • Techniki klastrów: k-średnie, k-medoidy, hierarchiczne klastryzowanie, SOM
  • Redukcja wymiarowości: PCA, analiza czynników, SVD
  • Skalowanie wielowymiarowe

Text Mining

  • Przetwarzanie tekstu i tokenizacja
  • Bag-of-words, redukcja do rdzenia i lematyzacja
  • Analiza sentymentu i częstotliwości słów
  • Wizualizacja danych tekstowych za pomocą chmur słów

Systemy Rekomendacyjne

  • Kolaboracyjne filtrowanie oparte na użytkowniku i oparte na przedmiocie
  • Projektowanie i ocena silników rekomendacyjnych

Wykrywanie wzorców związku

  • Częste zestawy przedmiotów i algorytm Apriori
  • Analiza koszyka zakupowego i współczynnik podnoszenia

Wykrywanie anomalii

  • Analiza wartości ekstremalnych
  • Metody oparte na odległości i gęstości
  • Wykrywanie anomalii w danych wielowymiarowych

Machine Learning Studium przypadku

  • Zrozumienie problemu biznesowego
  • Przetwarzanie danych i inżynieria cech
  • Wybór modelu i dostrajanie parametrów
  • Ocena i prezentacja wyników
  • Wdrożenie

Podsumowanie i Kolejne Kroki

Wymagania

  • Podstawowa znajomość statystyki i algebry liniowej
  • Znajomość koncepcji analizy danych lub business intelligence
  • Niektóre doświadczenie w programowaniu (najlepiej Python lub R) jest zalecane
  • Zainteresowanie nauką stosowanego uczenia maszynowego dla projektów opartych na danych

Grupa docelowa

  • Analitycy danych i naukowcy
  • Statystycy i profesjonaliści badawczy
  • Programiści i specjaliści IT eksplorujący narzędzia uczenia maszynowego
  • Każdy zaangażowany w projekty nauki o danych lub analityki przewidywanej
 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie