Plan Szkolenia

Wprowadzenie do uczenia maszynowego

  • Rodzaje uczenia maszynowego – nadzorowane vs. nienadzorowane
  • Od uczenia statystycznego do uczenia maszynowego
  • Przewodnik po procesie data mining: zrozumienie biznesu, przygotowanie danych, modelowanie, wdrażanie
  • Wybór odpowiedniego algorytmu dla zadania
  • Przeuczenie i kompromis pomiędzy biasem a variancją

Przegląd Pythona i bibliotek ML

  • Dlaczego używać języków programowania do ML
  • Wybór między R a Pythonem
  • Szybki kurs Pythona i Jupyter Notebooks
  • Biblioteki Pythona: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testowanie i ocena algorytmów ML

  • Generalizacja, przeuczenie i walidacja modelu
  • Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
  • Metryki dla regresji: ME, MSE, RMSE, MAPE
  • Metryki dla klasyfikacji: dokładność, macierz błędów, niezbilansowane klasy
  • Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
  • Wybór modelu i grid search dla dostrajania

Przygotowanie danych

  • Import i przechowywanie danych w Pythonie
  • Analiza eksploracyjna i statystyki podsumowujące
  • Obsługa brakujących wartości i wartości odstających
  • Standaryzacja, normalizacja i transformacja
  • Rekodowanie danych jakościowych i manipulacja danymi z użyciem pandas

Algorytmy klasyfikacji

  • Klasyfikacja binarna vs. wieloklasowa
  • Regresja logistyczna i funkcje dyskryminacyjne
  • Naïve Bayes, k-najbliższych sąsiadów
  • Drzewa decyzyjne: CART, Lasy Losowe, Bagging, Boosting, XGBoost
  • Maszyny wektorów nośnych i jądra
  • Techniki uczenia zbiorowego

Regresja i prognozowanie numeryczne

  • Metoda najmniejszych kwadratów i selekcja zmiennych
  • Metody regularizacji: L1, L2
  • Regresja wielomianowa i nie liniowe modele
  • Drzewa regresji i splajny

Sieci neuronowe

  • Wprowadzenie do sieci neuronowych i uczenia głębokiego
  • Funkcje aktywacji, warstwy i propagacja wsteczna
  • Wiele warstwowe perceptrony (MLP)
  • Używanie TensorFlow lub PyTorch do podstawowego modelowania sieci neuronowych
  • Sieci neuronowe do klasyfikacji i regresji

Prognozowanie sprzedaży i analiza predykcyjna

  • Prognozowanie szeregów czasowych vs. oparte na regresji
  • Obsługa danych sezonowych i trendowych
  • Budowanie modelu prognozowania sprzedaży za pomocą technik ML
  • Ocena dokładności i niepewności prognozy
  • Interpretacja biznesowa i komunikacja wyników

Uczenie nienadzorowane

  • Techniki klastrowania: k-means, k-medoids, hierarchiczne klastrowanie, SOMs
  • Redukcja wymiarowości: PCA, analiza czynnikowa, SVD
  • Wielowymiarowa skalowanie

Ekstrakcja informacji z tekstu

  • Przygotowanie tekstu i tokenizacja
  • Bag-of-words, redukcja do rdzenia i lemmatyzacja
  • Analiza sentymentu i częstotliwość słów
  • Wizualizacja danych tekstowych za pomocą chmur słów

Systemy rekomendacyjne

  • Filtr kolaboracyjny na podstawie użytkownika i przedmiotu
  • Projektowanie i ocena silników rekomendacji

Wydobywanie wzorców asocjacyjnych

  • Częste zestawy elementów i algorytm Apriori
  • Analiza koszyków zakupowych i współczynnik podnoszenia

Wykrywanie wyjątków

  • Analiza wartości ekstremalnych
  • Metody oparte na odległości i gęstości
  • Wykrywanie wyjątków w wysokowymiarowych danych

Studium przypadku uczenia maszynowego

  • Zrozumienie problemu biznesowego
  • Przygotowanie danych i inżynieria cech
  • Wybór modelu i dostrajanie parametrów
  • Ocena i prezentacja wyników
  • Wdrażanie

Podsumowanie i kolejne kroki

Wymagania

  • Podstawowa wiedza na temat pojęć uczenia maszynowego, takich jak uczenie nadzorowane i nie nadzorowane
  • Zapoznanie z programowaniem w języku Python (zmienne, pętle, funkcje)
  • Niektóre doświadczenie w obsłudze danych za pomocą bibliotek, takich jak pandas lub NumPy, jest pomocne, ale nie jest wymagane
  • Nie jest oczekiwane wcześniejsze doświadczenie z zaawansowanym modelowaniem lub sieciami neuronowymi

Grupa docelowa

  • Specjaliści od analizy danych
  • Analitycy biznesowi
  • Inżynierowie oprogramowania i profesjonaliści techniczni pracujący z danymi
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (2)

Propozycje terminów

Powiązane Kategorie