Plan Szkolenia
Wprowadzenie do uczenia maszynowego
- Rodzaje uczenia maszynowego – nadzorowane vs. nienadzorowane
- Od uczenia statystycznego do uczenia maszynowego
- Przewodnik po procesie data mining: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
- Wybór odpowiedniego algorytmu dla zadania
- Przeuczenie i kompromis pomiędzy biasem a variancją
Przegląd Pythona i bibliotek ML
- Dlaczego używać języków programowania do ML
- Wybór między R a Pythonem
- Szybki kurs Pythona i Jupyter Notebooks
- Biblioteki Pythona: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i ocena algorytmów ML
- Generalizacja, przeuczenie i walidacja modelu
- Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
- Metryki dla regresji: ME, MSE, RMSE, MAPE
- Metryki dla klasyfikacji: dokładność, macierz błędów, niezbilansowane klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
- Wybór modelu i grid search dla dostrajania
Przygotowanie danych
- Import i przechowywanie danych w Pythonie
- Analiza eksploracyjna i statystyki podsumowujące
- Obsługa brakujących wartości i wartości odstających
- Standaryzacja, normalizacja i transformacja
- Rekodowanie danych jakościowych i manipulacja danymi z użyciem pandas
Algorytmy klasyfikacji
- Klasyfikacja binarna vs. wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naïve Bayes, k-najbliższych sąsiadów
- Drzewa decyzyjne: CART, Lasy Losowe, Bagging, Boosting, XGBoost
- Maszyny wektorów nośnych i jądra
- Techniki uczenia zbiorowego
Regresja i prognozowanie numeryczne
- Metoda najmniejszych kwadratów i selekcja zmiennych
- Metody regularizacji: L1, L2
- Regresja wielomianowa i nie liniowe modele
- Drzewa regresji i splajny
Sieci neuronowe
- Wprowadzenie do sieci neuronowych i uczenia głębokiego
- Funkcje aktywacji, warstwy i propagacja wsteczna
- Wiele warstwowe perceptrony (MLP)
- Używanie TensorFlow lub PyTorch do podstawowego modelowania sieci neuronowych
- Sieci neuronowe do klasyfikacji i regresji
Prognozowanie sprzedaży i analiza predykcyjna
- Prognozowanie szeregów czasowych vs. oparte na regresji
- Obsługa danych sezonowych i trendowych
- Budowanie modelu prognozowania sprzedaży za pomocą technik ML
- Ocena dokładności i niepewności prognozy
- Interpretacja biznesowa i komunikacja wyników
Uczenie nienadzorowane
- Techniki klastrowania: k-means, k-medoids, hierarchiczne klastrowanie, SOMs
- Redukcja wymiarowości: PCA, analiza czynnikowa, SVD
- Wielowymiarowa skalowanie
Ekstrakcja informacji z tekstu
- Przygotowanie tekstu i tokenizacja
- Bag-of-words, redukcja do rdzenia i lemmatyzacja
- Analiza sentymentu i częstotliwość słów
- Wizualizacja danych tekstowych za pomocą chmur słów
Systemy rekomendacyjne
- Filtr kolaboracyjny na podstawie użytkownika i przedmiotu
- Projektowanie i ocena silników rekomendacji
Wydobywanie wzorców asocjacyjnych
- Częste zestawy elementów i algorytm Apriori
- Analiza koszyków zakupowych i współczynnik podnoszenia
Wykrywanie wyjątków
- Analiza wartości ekstremalnych
- Metody oparte na odległości i gęstości
- Wykrywanie wyjątków w wysokowymiarowych danych
Studium przypadku uczenia maszynowego
- Zrozumienie problemu biznesowego
- Przygotowanie danych i inżynieria cech
- Wybór modelu i dostrajanie parametrów
- Ocena i prezentacja wyników
- Wdrażanie
Podsumowanie i kolejne kroki
Wymagania
- Podstawowa wiedza na temat pojęć uczenia maszynowego, takich jak uczenie nadzorowane i nie nadzorowane
- Zapoznanie z programowaniem w języku Python (zmienne, pętle, funkcje)
- Niektóre doświadczenie w obsłudze danych za pomocą bibliotek, takich jak pandas lub NumPy, jest pomocne, ale nie jest wymagane
- Nie jest oczekiwane wcześniejsze doświadczenie z zaawansowanym modelowaniem lub sieciami neuronowymi
Grupa docelowa
- Specjaliści od analizy danych
- Analitycy biznesowi
- Inżynierowie oprogramowania i profesjonaliści techniczni pracujący z danymi
Opinie uczestników (2)
ekosystem ML nie tylko MLFlow, ale także Optuna, hyperops, docker i docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Szkolenie - MLflow
Przetłumaczone przez sztuczną inteligencję
Uczestniczenie w szkoleniu Kubeflow, które odbyło się zdalnie, było dla mnie bardzo przyjemne. To szkolenie pozwoliło mi ugruntować moją wiedzę dotyczącą usług AWS, K8s oraz wszystkich narzędzi devOps związanych z Kubeflow, które są niezbędnymi podstawami do właściwego podejścia do tematu. Chciałbym podziękować Malawskiemu Marcinowi za jego cierpliwość i profesjonalizm w trakcie szkolenia oraz za rady dotyczące najlepszych praktyk. Malawski podejmuje temat z różnych perspektyw, różnych narzędzi wdrażania Ansible, EKS kubectl, Terraform. Teraz jestem zdecydowanie przekonany, że wybieram właściwy kierunek aplikacji.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Szkolenie - Kubeflow
Przetłumaczone przez sztuczną inteligencję