Plan Szkolenia

Wprowadzenie do uczenia maszynowego

  • Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
  • Od statystycznego uczenia do uczenia maszynowego
  • Proces eksploracji danych: zrozumienie biznesowe, przygotowanie danych, modelowanie, wdrożenie
  • Wybór odpowiedniego algorytmu do zadania
  • Przetrenowanie i kompromis między błędem a wariancją

Przegląd Pythona i bibliotek do uczenia maszynowego

  • Dlaczego używać języków programowania do uczenia maszynowego
  • Wybór między R a Pythonem
  • Szybki kurs Pythona i notatniki Jupyter
  • Biblioteki Pythona: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testowanie i ocena algorytmów uczenia maszynowego

  • Generalizacja, przetrenowanie i walidacja modelu
  • Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
  • Metryki dla regresji: ME, MSE, RMSE, MAPE
  • Metryki dla klasyfikacji: dokładność, macierz pomyłek, niezrównoważone klasy
  • Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
  • Wybór modelu i strojenie parametrów za pomocą siatki

Przygotowanie danych

  • Importowanie i przechowywanie danych w Pythonie
  • Analiza eksploracyjna i statystyki podsumowujące
  • Obsługa brakujących wartości i wartości odstających
  • Standaryzacja, normalizacja i transformacja
  • Rekodowanie danych jakościowych i manipulacja danymi za pomocą pandas

Algorytmy klasyfikacji

  • Klasyfikacja binarna vs wieloklasowa
  • Regresja logistyczna i funkcje dyskryminacyjne
  • Naiwny Bayes, k-najbliższych sąsiadów
  • Drzewa decyzyjne: CART, Random Forests, Bagging, Boosting, XGBoost
  • Maszyny wektorów nośnych i jądra
  • Techniki uczenia zespołowego

Regresja i predykcja numeryczna

  • Metoda najmniejszych kwadratów i wybór zmiennych
  • Metody regularyzacji: L1, L2
  • Regresja wielomianowa i modele nieliniowe
  • Drzewa regresyjne i splajny

Uczenie nienadzorowane

  • Techniki grupowania: k-średnich, k-medoidów, grupowanie hierarchiczne, SOM
  • Redukcja wymiarowości: PCA, analiza czynnikowa, SVD
  • Skalowanie wielowymiarowe

Eksploracja tekstu

  • Przetwarzanie wstępne tekstu i tokenizacja
  • Worek słów, stemming i lematyzacja
  • Analiza sentymentu i częstotliwość słów
  • Wizualizacja danych tekstowych za pomocą chmur słów

Systemy rekomendacyjne

  • Filtrowanie współpracujące oparte na użytkownikach i przedmiotach
  • Projektowanie i ocena silników rekomendacyjnych

Eksploracja wzorców asocjacyjnych

  • Częste zbiory elementów i algorytm Apriori
  • Analiza koszykowa i współczynnik liftu

Wykrywanie wartości odstających

  • Analiza skrajnych wartości
  • Metody oparte na odległości i gęstości
  • Wykrywanie wartości odstających w danych wielowymiarowych

Studium przypadku uczenia maszynowego

  • Zrozumienie problemu biznesowego
  • Przetwarzanie wstępne danych i inżynieria cech
  • Wybór modelu i strojenie parametrów
  • Ocena i prezentacja wyników
  • Wdrożenie

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowa znajomość statystyki i algebry liniowej
  • Znajomość pojęć związanych z analizą danych lub business intelligence
  • Zalecane jest wcześniejsze doświadczenie z programowaniem (najlepiej Python lub R)
  • Zainteresowanie uczeniem maszynowym w projektach opartych na danych

Grupa docelowa

  • Analitycy danych i naukowcy
  • Statystycy i profesjonaliści badawczy
  • Programiści i profesjonaliści IT eksplorujący narzędzia uczenia maszynowego
  • Wszyscy zaangażowani w projekty z zakresu nauki o danych lub analizy predykcyjnej
 21 godzin

Liczba uczestników


Cena za uczestnika

Opinie uczestników (5)

Propozycje terminów

Powiązane Kategorie