Plan Szkolenia
Wprowadzenie do uczenia maszynowego
- Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
- Od statystycznego uczenia do uczenia maszynowego
- Proces eksploracji danych: zrozumienie biznesowe, przygotowanie danych, modelowanie, wdrożenie
- Wybór odpowiedniego algorytmu do zadania
- Przetrenowanie i kompromis między błędem a wariancją
Przegląd Pythona i bibliotek do uczenia maszynowego
- Dlaczego używać języków programowania do uczenia maszynowego
- Wybór między R a Pythonem
- Szybki kurs Pythona i notatniki Jupyter
- Biblioteki Pythona: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i ocena algorytmów uczenia maszynowego
- Generalizacja, przetrenowanie i walidacja modelu
- Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
- Metryki dla regresji: ME, MSE, RMSE, MAPE
- Metryki dla klasyfikacji: dokładność, macierz pomyłek, niezrównoważone klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
- Wybór modelu i strojenie parametrów za pomocą siatki
Przygotowanie danych
- Importowanie i przechowywanie danych w Pythonie
- Analiza eksploracyjna i statystyki podsumowujące
- Obsługa brakujących wartości i wartości odstających
- Standaryzacja, normalizacja i transformacja
- Rekodowanie danych jakościowych i manipulacja danymi za pomocą pandas
Algorytmy klasyfikacji
- Klasyfikacja binarna vs wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naiwny Bayes, k-najbliższych sąsiadów
- Drzewa decyzyjne: CART, Random Forests, Bagging, Boosting, XGBoost
- Maszyny wektorów nośnych i jądra
- Techniki uczenia zespołowego
Regresja i predykcja numeryczna
- Metoda najmniejszych kwadratów i wybór zmiennych
- Metody regularyzacji: L1, L2
- Regresja wielomianowa i modele nieliniowe
- Drzewa regresyjne i splajny
Uczenie nienadzorowane
- Techniki grupowania: k-średnich, k-medoidów, grupowanie hierarchiczne, SOM
- Redukcja wymiarowości: PCA, analiza czynnikowa, SVD
- Skalowanie wielowymiarowe
Eksploracja tekstu
- Przetwarzanie wstępne tekstu i tokenizacja
- Worek słów, stemming i lematyzacja
- Analiza sentymentu i częstotliwość słów
- Wizualizacja danych tekstowych za pomocą chmur słów
Systemy rekomendacyjne
- Filtrowanie współpracujące oparte na użytkownikach i przedmiotach
- Projektowanie i ocena silników rekomendacyjnych
Eksploracja wzorców asocjacyjnych
- Częste zbiory elementów i algorytm Apriori
- Analiza koszykowa i współczynnik liftu
Wykrywanie wartości odstających
- Analiza skrajnych wartości
- Metody oparte na odległości i gęstości
- Wykrywanie wartości odstających w danych wielowymiarowych
Studium przypadku uczenia maszynowego
- Zrozumienie problemu biznesowego
- Przetwarzanie wstępne danych i inżynieria cech
- Wybór modelu i strojenie parametrów
- Ocena i prezentacja wyników
- Wdrożenie
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa znajomość statystyki i algebry liniowej
- Znajomość pojęć związanych z analizą danych lub business intelligence
- Zalecane jest wcześniejsze doświadczenie z programowaniem (najlepiej Python lub R)
- Zainteresowanie uczeniem maszynowym w projektach opartych na danych
Grupa docelowa
- Analitycy danych i naukowcy
- Statystycy i profesjonaliści badawczy
- Programiści i profesjonaliści IT eksplorujący narzędzia uczenia maszynowego
- Wszyscy zaangażowani w projekty z zakresu nauki o danych lub analizy predykcyjnej
Opinie uczestników (5)
Nawet mimo tego, że musiało mi zdarzyć się zapuścić jeden dzień z powodu spotkań z klientami, czuję, że mam znacznie jaśniejsze pojęcie o procesach i technikach stosowanych w uczeniu maszynowym oraz kiedy powinienem wybrać jedno podejście zamiast drugiego. Naszym wyzwaniem teraz jest ćwiczenie tego, czego nauczyliśmy się, i zaczęcie zastosowywać to do naszej dziedziny problemowej.
Richard Blewett - Rock Solid Knowledge Ltd
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję
Live coding, mocna argumentacja przykładów teorią.
Filip Derenowski - Weegree Sp. z o.o. S.K.
Szkolenie - Machine Learning – Data science
przedstawione wiedza zarówno praktyczna jak i teoretyczna, jedna uzupełniająca drugą. Sposób prowadzenia bardzo ciekawy. Zero nudy. Dużo wiedzy, życiowych przykładów
Bartosz Matuszek - Weegree Sp. z o.o. S.K.
Szkolenie - Machine Learning – Data science
Podoba mi się, że szkolenie było skoncentrowane na przykładach i programowaniu. Myślałem, że nie jest możliwe zmieścić tak wiele treści w trzech dniach szkolenia, ale miałem rację. Szkolenie objęło wiele tematów, a wszystko zostało wykonane w bardzo szczegółowy sposób (zwłaszcza dopasowywanie parametrów modelu - nie spodziewałem się, że będzie na to czas i byłem bardzo zaskoczony).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję
Pokazuje wiele metod z przygotowanymi skryptami - bardzo dobrze przygotowane materiały i łatwe do śledzenia.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Szkolenie - Machine Learning – Data science
Przetłumaczone przez sztuczną inteligencję