Plan Szkolenia
Machine Learning Wprowadzenie
- Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
- Od uczenia statystycznego do uczenia maszynowego
- Przepływ pracy w data mining: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
- Wybór odpowiedniego algorytmu dla zadania
- Przeuczenie i kompromis między uprzedzeniami a warianacją
Python i Przegląd Bibliotek ML
- Dlaczego używać języków programowania do ML
- Wybór między R a Python
- Python kurs podstawowy i Notatniki Jupyter
- Python biblioteki: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i Ocena Algorytmów ML
- Generalizacja, przeuczenie i walidacja modelu
- Strategie oceny: holdout, walidacja krzyżowa, bootstrapping
- Miary dla regresji: ME, MSE, RMSE, MAPE
- Miary dla klasyfikacji: dokładność, macierz błędów, niezbilansowane klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa podnoszenia
- Wybór modelu i przeszukiwanie siatki do dostrajania
Przygotowanie Danych
- Import i przechowywanie danych w Python
- Eksploracyjna analiza i statystyki podsumowujące
- Obsługa brakujących wartości i wartości odchylających
- Standaryzacja, normalizacja i transformacja
- Przekodowanie danych jakościowych i manipulowanie danymi z użyciem pandas
Algorytmy Klasyfikacji
- Klasyfikacja binarna vs wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naïve Bayes, k-najbliższych sąsiadów
- Drzewa decyzyjne: CART, Random Foresty, Bagging, Boosting, XGBoost
- Maszyny wektorów nośnych i jądra
- Techniki uczenia zespołowego
Regresja i Numeryczna Predykcja
- Metoda najmniejszych kwadratów i wybór zmiennych
- Metody regularizacji: L1, L2
- Regresja wielomianowa i niełatwe modele
- Drzewa regresji i splajny
Unsupervised Learning
- Techniki klastrów: k-średnie, k-medoidy, hierarchiczne klastryzowanie, SOM
- Redukcja wymiarowości: PCA, analiza czynników, SVD
- Skalowanie wielowymiarowe
Text Mining
- Przetwarzanie tekstu i tokenizacja
- Bag-of-words, redukcja do rdzenia i lematyzacja
- Analiza sentymentu i częstotliwości słów
- Wizualizacja danych tekstowych za pomocą chmur słów
Systemy Rekomendacyjne
- Kolaboracyjne filtrowanie oparte na użytkowniku i oparte na przedmiocie
- Projektowanie i ocena silników rekomendacyjnych
Wykrywanie wzorców związku
- Częste zestawy przedmiotów i algorytm Apriori
- Analiza koszyka zakupowego i współczynnik podnoszenia
Wykrywanie anomalii
- Analiza wartości ekstremalnych
- Metody oparte na odległości i gęstości
- Wykrywanie anomalii w danych wielowymiarowych
Machine Learning Studium przypadku
- Zrozumienie problemu biznesowego
- Przetwarzanie danych i inżynieria cech
- Wybór modelu i dostrajanie parametrów
- Ocena i prezentacja wyników
- Wdrożenie
Podsumowanie i Kolejne Kroki
Wymagania
- Podstawowa znajomość statystyki i algebry liniowej
- Znajomość koncepcji analizy danych lub business intelligence
- Niektóre doświadczenie w programowaniu (najlepiej Python lub R) jest zalecane
- Zainteresowanie nauką stosowanego uczenia maszynowego dla projektów opartych na danych
Grupa docelowa
- Analitycy danych i naukowcy
- Statystycy i profesjonaliści badawczy
- Programiści i specjaliści IT eksplorujący narzędzia uczenia maszynowego
- Każdy zaangażowany w projekty nauki o danych lub analityki przewidywanej
Opinie uczestników (5)
Chociaż musiałem opuścić jeden dzień ze względu na spotkania z klientami, czuję, że mam dużo klarowniejsze zrozumienie procesów i technik używanych w Machine Learning oraz kiedy stosować jeden podejście zamiast innego. Naszym zadaniem jest teraz praktykować to, czego się nauczyliśmy, i zacząć stosować to w naszym dziedzinie problemów.
Richard Blewett - Rock Solid Knowledge Ltd
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję
Live coding, mocna argumentacja przykładów teorią.
Filip Derenowski - Weegree Sp. z o.o. S.K.
Szkolenie - Machine Learning – Data science
przedstawione wiedza zarówno praktyczna jak i teoretyczna, jedna uzupełniająca drugą. Sposób prowadzenia bardzo ciekawy. Zero nudy. Dużo wiedzy, życiowych przykładów
Bartosz Matuszek - Weegree Sp. z o.o. S.K.
Szkolenie - Machine Learning – Data science
Oceń, że szkolenie było skoncentrowane na przykładach i kodowaniu. Myślałem, że niemożliwe jest zamknięcie takiej ilości treści w trzy dni szkolenia, ale okazało się, że pomyliłem się. Szkolenie obejmowało wiele tematów i wszystko było wykonywane w bardzo szczegółowy sposób (zwłaszcza dostrajanie parametrów modelu - nie spodziewałem się, że będzie na to czas i byłem bardzo zaskoczony).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję
To jest przedstawia wiele metod z przygotowanymi skryptami - bardzo dobrze przygotowane materiały i łatwe do śledzenia.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję