Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Machine Learning Wprowadzenie
- Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
- Od uczenia statystycznego do uczenia maszynowego
- Przepływ pracy w data mining: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
- Wybór odpowiedniego algorytmu dla zadania
- Przeuczenie i kompromis między uprzedzeniami a warianacją
Python i Przegląd Bibliotek ML
- Dlaczego używać języków programowania do ML
- Wybór między R a Python
- Python kurs podstawowy i Notatniki Jupyter
- Python biblioteki: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i Ocena Algorytmów ML
- Generalizacja, przeuczenie i walidacja modelu
- Strategie oceny: holdout, walidacja krzyżowa, bootstrapping
- Miary dla regresji: ME, MSE, RMSE, MAPE
- Miary dla klasyfikacji: dokładność, macierz błędów, niezbilansowane klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa podnoszenia
- Wybór modelu i przeszukiwanie siatki do dostrajania
Przygotowanie Danych
- Import i przechowywanie danych w Python
- Eksploracyjna analiza i statystyki podsumowujące
- Obsługa brakujących wartości i wartości odchylających
- Standaryzacja, normalizacja i transformacja
- Przekodowanie danych jakościowych i manipulowanie danymi z użyciem pandas
Algorytmy Klasyfikacji
- Klasyfikacja binarna vs wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naïve Bayes, k-najbliższych sąsiadów
- Drzewa decyzyjne: CART, Random Foresty, Bagging, Boosting, XGBoost
- Maszyny wektorów nośnych i jądra
- Techniki uczenia zespołowego
Regresja i Numeryczna Predykcja
- Metoda najmniejszych kwadratów i wybór zmiennych
- Metody regularizacji: L1, L2
- Regresja wielomianowa i niełatwe modele
- Drzewa regresji i splajny
Unsupervised Learning
- Techniki klastrów: k-średnie, k-medoidy, hierarchiczne klastryzowanie, SOM
- Redukcja wymiarowości: PCA, analiza czynników, SVD
- Skalowanie wielowymiarowe
Text Mining
- Przetwarzanie tekstu i tokenizacja
- Bag-of-words, redukcja do rdzenia i lematyzacja
- Analiza sentymentu i częstotliwości słów
- Wizualizacja danych tekstowych za pomocą chmur słów
Systemy Rekomendacyjne
- Kolaboracyjne filtrowanie oparte na użytkowniku i oparte na przedmiocie
- Projektowanie i ocena silników rekomendacyjnych
Wykrywanie wzorców związku
- Częste zestawy przedmiotów i algorytm Apriori
- Analiza koszyka zakupowego i współczynnik podnoszenia
Wykrywanie anomalii
- Analiza wartości ekstremalnych
- Metody oparte na odległości i gęstości
- Wykrywanie anomalii w danych wielowymiarowych
Machine Learning Studium przypadku
- Zrozumienie problemu biznesowego
- Przetwarzanie danych i inżynieria cech
- Wybór modelu i dostrajanie parametrów
- Ocena i prezentacja wyników
- Wdrożenie
Podsumowanie i Kolejne Kroki
Wymagania
- Podstawowa znajomość statystyki i algebry liniowej
- Znajomość koncepcji analizy danych lub business intelligence
- Niektóre doświadczenie w programowaniu (najlepiej Python lub R) jest zalecane
- Zainteresowanie nauką stosowanego uczenia maszynowego dla projektów opartych na danych
Grupa docelowa
- Analitycy danych i naukowcy
- Statystycy i profesjonaliści badawczy
- Programiści i specjaliści IT eksplorujący narzędzia uczenia maszynowego
- Każdy zaangażowany w projekty nauki o danych lub analityki przewidywanej
21 godzin