Plan Szkolenia
Wprowadzenie do Uczenia Maszynowego
- Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
- Od uczenia statystycznego do uczenia maszynowego
- Proces eksploracji danych: zrozumienie biznesowe, przygotowanie danych, modelowanie, wdrożenie
- Wybór odpowiedniego algorytmu do zadania
- Przetrenowanie i kompromis między błędem a wariancją
Przegląd Pythona i Bibliotek do Uczenia Maszynowego
- Dlaczego używać języków programowania do uczenia maszynowego
- Wybór między R a Pythonem
- Szybki kurs Pythona i Jupyter Notebooks
- Biblioteki Pythona: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testowanie i Ocena Algorytmów Uczenia Maszynowego
- Generalizacja, przetrenowanie i walidacja modelu
- Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
- Metryki dla regresji: ME, MSE, RMSE, MAPE
- Metryki dla klasyfikacji: dokładność, macierz pomyłek, niezrównoważone klasy
- Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
- Wybór modelu i strojenie za pomocą siatki
Przygotowanie Danych
- Import i przechowywanie danych w Pythonie
- Eksploracyjna analiza danych i statystyki podsumowujące
- Obsługa brakujących wartości i wartości odstających
- Standaryzacja, normalizacja i transformacja
- Przekształcanie danych jakościowych i manipulacja danymi za pomocą pandas
Algorytmy Klasyfikacji
- Klasyfikacja binarna vs wieloklasowa
- Regresja logistyczna i funkcje dyskryminacyjne
- Naiwny Bayes, k-najbliższych sąsiadów
- Drzewa decyzyjne: CART, Random Forests, Bagging, Boosting, XGBoost
- Maszyny wektorów nośnych i jądra
- Techniki uczenia zespołowego
Regresja i Prognozowanie Numeryczne
- Metoda najmniejszych kwadratów i selekcja zmiennych
- Metody regularyzacji: L1, L2
- Regresja wielomianowa i modele nieliniowe
- Drzewa regresyjne i splajny
Sieci Neuronowe
- Wprowadzenie do sieci neuronowych i głębokiego uczenia
- Funkcje aktywacji, warstwy i wsteczna propagacja
- Wielowarstwowe perceptrony (MLP)
- Użycie TensorFlow lub PyTorch do podstawowego modelowania sieci neuronowych
- Sieci neuronowe do klasyfikacji i regresji
Prognozowanie Sprzedaży i Analiza Predykcyjna
- Prognozowanie oparte na szeregach czasowych vs regresji
- Obsługa danych sezonowych i trendowych
- Budowanie modelu prognozowania sprzedaży przy użyciu technik uczenia maszynowego
- Ocena dokładności prognozy i niepewności
- Interpretacja biznesowa i komunikacja wyników
Uczenie Nienadzorowane
- Techniki grupowania: k-średnich, k-medoidów, grupowanie hierarchiczne, SOM
- Redukcja wymiarowości: PCA, analiza czynnikowa, SVD
- Skalowanie wielowymiarowe
Eksploracja Tekstów
- Wstępne przetwarzanie tekstu i tokenizacja
- Model worek słów, stemming i lematyzacja
- Analiza sentymentu i częstotliwość słów
- Wizualizacja danych tekstowych za pomocą chmur słów
Systemy Rekomendacyjne
- Filtrowanie kolaboratywne oparte na użytkownikach i przedmiotach
- Projektowanie i ocena silników rekomendacyjnych
Eksploracja Wzorców Asocjacyjnych
- Częste zbiory przedmiotów i algorytm Apriori
- Analiza koszykowa i współczynnik liftu
Wykrywanie Wartości Odstających
- Analiza skrajnych wartości
- Metody oparte na odległości i gęstości
- Wykrywanie wartości odstających w danych wielowymiarowych
Studium Przypadku Uczenia Maszynowego
- Zrozumienie problemu biznesowego
- Przetwarzanie wstępne danych i inżynieria cech
- Wybór modelu i strojenie parametrów
- Ocena i prezentacja wyników
- Wdrożenie
Podsumowanie i Kolejne Kroki
Wymagania
- Podstawowa wiedza na temat koncepcji uczenia maszynowego, takich jak uczenie nadzorowane i nienadzorowane
- Znajomość programowania w Pythonie (zmienne, pętle, funkcje)
- Doświadczenie w pracy z danymi przy użyciu bibliotek takich jak pandas lub NumPy jest pomocne, ale nie jest wymagane
- Nie oczekuje się wcześniejszego doświadczenia z zaawansowanym modelowaniem lub sieciami neuronowymi
Grupa docelowa
- Analitycy danych
- Analitycy biznesowi
- Inżynierowie oprogramowania i specjaliści techniczni pracujący z danymi
Opinie uczestników (2)
ekosystem ML obejmuje nie tylko MLFlow, ale także Optuna, hyperops, Docker i docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Szkolenie - MLflow
Przetłumaczone przez sztuczną inteligencję
Cieszyłem się, biorąc udział w szkoleniu Kubeflow, które odbyło się zdalnie. To szkolenie pozwoliło mi ukonsolidować wiedzę na temat usług AWS, K8s oraz wszystkich narzędzi devOps związanych z Kubeflow, które stanowią niezbędne podstawy do właściwego podejścia do tego tematu. Chciałbym podziękować Marcina Malawskiego za jego cierpliwość i profesjonalizm w zakresie szkolenia oraz rad na temat najlepszych praktyk. Marcin podejmuje temat z różnych perspektyw, wykorzystując różne narzędzia wdrażania, takie jak Ansible, EKS kubectl, Terraform. Teraz jestem absolutnie przekonany, że wchodzę w właściwe pole zastosowania.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Szkolenie - Kubeflow
Przetłumaczone przez sztuczną inteligencję