Plan Szkolenia
Machine Learning Wprowadzenie
- Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
- Od uczenia statystycznego do uczenia maszynowego
- Przepływ pracy w data mining: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
- Wybór odpowiedniego algorytmu dla zadania
- Przeuczenie i kompromis między uprzedzeniami a warianacją
Python i Przegląd Bibliotek ML
- Dlaczego używać języków programowania do ML
- Wybór między R a Python
- Python kurs podstawowy i Notatniki Jupyter
- Python biblioteki: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i Ocena Algorytmów ML
- Generalizacja, przeuczenie i walidacja modelu
- Strategie oceny: holdout, walidacja krzyżowa, bootstrapping
- Miary dla regresji: ME, MSE, RMSE, MAPE
- Miary dla klasyfikacji: dokładność, macierz błędów, niezbilansowane klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa podnoszenia
- Wybór modelu i przeszukiwanie siatki do dostrajania
Przygotowanie Danych
- Import i przechowywanie danych w Python
- Eksploracyjna analiza i statystyki podsumowujące
- Obsługa brakujących wartości i wartości odchylających
- Standaryzacja, normalizacja i transformacja
- Przekodowanie danych jakościowych i manipulowanie danymi z użyciem pandas
Algorytmy Klasyfikacji
- Klasyfikacja binarna vs wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naïve Bayes, k-najbliższych sąsiadów
- Drzewa decyzyjne: CART, Random Foresty, Bagging, Boosting, XGBoost
- Maszyny wektorów nośnych i jądra
- Techniki uczenia zespołowego
Regresja i Numeryczna Predykcja
- Metoda najmniejszych kwadratów i wybór zmiennych
- Metody regularizacji: L1, L2
- Regresja wielomianowa i niełatwe modele
- Drzewa regresji i splajny
Unsupervised Learning
- Techniki klastrów: k-średnie, k-medoidy, hierarchiczne klastryzowanie, SOM
- Redukcja wymiarowości: PCA, analiza czynników, SVD
- Skalowanie wielowymiarowe
Text Mining
- Przetwarzanie tekstu i tokenizacja
- Bag-of-words, redukcja do rdzenia i lematyzacja
- Analiza sentymentu i częstotliwości słów
- Wizualizacja danych tekstowych za pomocą chmur słów
Systemy Rekomendacyjne
- Kolaboracyjne filtrowanie oparte na użytkowniku i oparte na przedmiocie
- Projektowanie i ocena silników rekomendacyjnych
Wykrywanie wzorców związku
- Częste zestawy przedmiotów i algorytm Apriori
- Analiza koszyka zakupowego i współczynnik podnoszenia
Wykrywanie anomalii
- Analiza wartości ekstremalnych
- Metody oparte na odległości i gęstości
- Wykrywanie anomalii w danych wielowymiarowych
Machine Learning Studium przypadku
- Zrozumienie problemu biznesowego
- Przetwarzanie danych i inżynieria cech
- Wybór modelu i dostrajanie parametrów
- Ocena i prezentacja wyników
- Wdrożenie
Podsumowanie i Kolejne Kroki
Wymagania
- Podstawowa znajomość statystyki i algebry liniowej
- Znajomość koncepcji analizy danych lub business intelligence
- Niektóre doświadczenie w programowaniu (najlepiej Python lub R) jest zalecane
- Zainteresowanie nauką stosowanego uczenia maszynowego dla projektów opartych na danych
Grupa docelowa
- Analitycy danych i naukowcy
- Statystycy i profesjonaliści badawczy
- Programiści i specjaliści IT eksplorujący narzędzia uczenia maszynowego
- Każdy zaangażowany w projekty nauki o danych lub analityki przewidywanej
Opinie uczestników (5)
Nawet mimo tego, że musiało mi zdarzyć się zapuścić jeden dzień z powodu spotkań z klientami, czuję, że mam znacznie jaśniejsze pojęcie o procesach i technikach stosowanych w uczeniu maszynowym oraz kiedy powinienem wybrać jedno podejście zamiast drugiego. Naszym wyzwaniem teraz jest ćwiczenie tego, czego nauczyliśmy się, i zaczęcie zastosowywać to do naszej dziedziny problemowej.
Richard Blewett - Rock Solid Knowledge Ltd
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję
Live coding, mocna argumentacja przykładów teorią.
Filip Derenowski - Weegree Sp. z o.o. S.K.
Szkolenie - Machine Learning – Data science
przedstawione wiedza zarówno praktyczna jak i teoretyczna, jedna uzupełniająca drugą. Sposób prowadzenia bardzo ciekawy. Zero nudy. Dużo wiedzy, życiowych przykładów
Bartosz Matuszek - Weegree Sp. z o.o. S.K.
Szkolenie - Machine Learning – Data science
Podoba mi się, że szkolenie było skoncentrowane na przykładach i programowaniu. Myślałem, że nie jest możliwe zmieścić tak wiele treści w trzech dniach szkolenia, ale miałem rację. Szkolenie objęło wiele tematów, a wszystko zostało wykonane w bardzo szczegółowy sposób (zwłaszcza dopasowywanie parametrów modelu - nie spodziewałem się, że będzie na to czas i byłem bardzo zaskoczony).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję
Pokazuje wiele metod z przygotowanymi skryptami - bardzo dobrze przygotowane materiały i łatwe do śledzenia.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję