Plan Szkolenia
Machine Learning Wprowadzenie
- Typy uczenia maszynowego – nadzorowane vs. nienadzorowane
- Od uczenia statystycznego do uczenia maszynowego
- Przepływ pracy w data miningu: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
- Wybór odpowiedniego algorytmu dla zadania
- Przeuczenie i kompromis między uprzedzeniem a zmiennością
Python i Przegląd Bibliotek ML
- Dlaczego używać języków programowania do ML
- Wybór między R a Python
- Kurs intensywny z Python i Jupyter Notebooks
- Biblioteki Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i Ocenianie Algorytmów ML
- Generalizacja, przeuczenie i walidacja modelu
- Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
- Metryki dla regresji: ME, MSE, RMSE, MAPE
- Metryki dla klasyfikacji: dokładność, macierz błędów, niezbalansowane klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
- Wybór modelu i grid search dla dostrajania
Przygotowanie Danych
- Import i przechowywanie danych w Python
- Eksploracyjna analiza i statystyki podsumowujące
- Obsługa braków danych i wartości odstających
- Standaryzacja, normalizacja i transformacja
- Kodowanie danych jakościowych i manipulowanie danymi za pomocą pandas
Algorytmy Klasyfikacji
- Klasyfikacja binarna vs. wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naïve Bayes, k-nearest neighbors
- Drzewa decyzyjne: CART, Random Forests, Bagging, Boosting, XGBoost
- Maszyny wektorów wspierających i jądra
- Techniki uczenia zbiorowego
Regresja i Numeryczna Prognoza
- Metoda najmniejszych kwadratów i wybór zmiennych
- Metody regularizacji: L1, L2
- Regresja wielomianowa i modele nieliniowe
- Drzewa regresji i splajny
Neural Networks
- Wprowadzenie do sieci neuronowych i uczenia głębokiego
- Funkcje aktywacji, warstwy i propagacja wsteczna
- Wielowarstwowe perceptrony (MLP)
- Używanie TensorFlow lub PyTorch do podstawowego modelowania sieci neuronowych
- Sieci neuronowe do klasyfikacji i regresji
Prognozowanie sprzedaży Forecasting i Predictive Analytics
- Czasowe szeregi vs. prognozowanie opierające się na regresji
- Obsługa sezonowych i trendowych danych
- Budowanie modelu prognozowania sprzedaży z użyciem technik ML
- Ocena dokładności i niepewności prognozy
- Business interpretacja i komunikacja wyników
Unsupervised Learning
- Techniki klastrowania: k-means, k-medoidy, hierarchiczne klastrowanie, SOMs
- Redukcja wymiarowości: PCA, analiza czynników, SVD
- Skalowanie wielowymiarowe
Tekst Mining
- Przetwarzanie tekstu i tokenizacja
- Bag-of-words, łamanie wyrazów i lemmatyzacja
- Analiza nastroju i częstotliwość słów
- Wizualizacja danych tekstowych z chmurami słów
Systemy Rekomendacji
- Filtr kolaboracyjny oparty na użytkownikach i przedmiotach
- Projektowanie i ocenianie silników rekomendacyjnych
Górnicze Wzorce Asocjacji
- Częste zestawy przedmiotów i algorytm Apriori
- Analiza koszyka zakupów i współczynnik podniesienia
Wykrywanie Anomalii
- Analiza wartości skrajnych
- Metody opierające się na odległości i gęstości
- Wykrywanie anomalii w danych wielowymiarowych
Machine Learning Studium Przypadku
- Zrozumienie problemu biznesowego
- Przetwarzanie danych i inżynieria cech
- Wybór modelu i dostrajanie parametrów
- Ocena i prezentacja wyników
- Wdrażanie
Podsumowanie i Kolejne Kroki
Wymagania
- Podstawowa wiedza na temat pojęć uczenia maszynowego, takich jak uczenie nadzorowane i nienadzorowane
- Znajomość programowania w Python (zmienne, pętle, funkcje)
- Niektóre doświadczenie w obsłudze danych za pomocą bibliotek, takich jak pandas lub NumPy, jest pomocne, ale nie jest wymagane
- Nie oczekuje się wcześniejszego doświadczenia z zaawansowanym modelowaniem lub sieciami neuronowymi
Grupa docelowa
- Naukowcy danych
- Specjaliści Business
- Inżynierowie oprogramowania i profesjonaliści techniczni pracujący z danymi
Opinie uczestników (2)
ekosystem ML nie tylko MLFlow, ale także Optuna, hyperops, docker i docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Szkolenie - MLflow
Przetłumaczone przez sztuczną inteligencję
Uczestniczenie w szkoleniu Kubeflow, które odbyło się zdalnie, było dla mnie bardzo przyjemne. To szkolenie pozwoliło mi ugruntować moją wiedzę dotyczącą usług AWS, K8s oraz wszystkich narzędzi devOps związanych z Kubeflow, które są niezbędnymi podstawami do właściwego podejścia do tematu. Chciałbym podziękować Malawskiemu Marcinowi za jego cierpliwość i profesjonalizm w trakcie szkolenia oraz za rady dotyczące najlepszych praktyk. Malawski podejmuje temat z różnych perspektyw, różnych narzędzi wdrażania Ansible, EKS kubectl, Terraform. Teraz jestem zdecydowanie przekonany, że wybieram właściwy kierunek aplikacji.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Szkolenie - Kubeflow
Przetłumaczone przez sztuczną inteligencję