Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie do Uczenia Maszynowego

  • Rodzaje uczenia maszynowego – nadzorowane vs nienadzorowane
  • Od uczenia statystycznego do uczenia maszynowego
  • Proces eksploracji danych: zrozumienie biznesowe, przygotowanie danych, modelowanie, wdrożenie
  • Wybór odpowiedniego algorytmu do zadania
  • Przetrenowanie i kompromis między błędem a wariancją

Przegląd Pythona i Bibliotek do Uczenia Maszynowego

  • Dlaczego używać języków programowania do uczenia maszynowego
  • Wybór między R a Pythonem
  • Szybki kurs Pythona i Jupyter Notebooks
  • Biblioteki Pythona: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testowanie i Ocena Algorytmów Uczenia Maszynowego

  • Generalizacja, przetrenowanie i walidacja modelu
  • Strategie oceny: holdout, krzyżowa walidacja, bootstrapping
  • Metryki dla regresji: ME, MSE, RMSE, MAPE
  • Metryki dla klasyfikacji: dokładność, macierz pomyłek, niezrównoważone klasy
  • Wizualizacja wydajności modelu: krzywa zysku, krzywa ROC, krzywa liftu
  • Wybór modelu i strojenie za pomocą siatki

Przygotowanie Danych

  • Import i przechowywanie danych w Pythonie
  • Eksploracyjna analiza danych i statystyki podsumowujące
  • Obsługa brakujących wartości i wartości odstających
  • Standaryzacja, normalizacja i transformacja
  • Przekształcanie danych jakościowych i manipulacja danymi za pomocą pandas

Algorytmy Klasyfikacji

  • Klasyfikacja binarna vs wieloklasowa
  • Regresja logistyczna i funkcje dyskryminacyjne
  • Naiwny Bayes, k-najbliższych sąsiadów
  • Drzewa decyzyjne: CART, Random Forests, Bagging, Boosting, XGBoost
  • Maszyny wektorów nośnych i jądra
  • Techniki uczenia zespołowego

Regresja i Prognozowanie Numeryczne

  • Metoda najmniejszych kwadratów i selekcja zmiennych
  • Metody regularyzacji: L1, L2
  • Regresja wielomianowa i modele nieliniowe
  • Drzewa regresyjne i splajny

Sieci Neuronowe

  • Wprowadzenie do sieci neuronowych i głębokiego uczenia
  • Funkcje aktywacji, warstwy i wsteczna propagacja
  • Wielowarstwowe perceptrony (MLP)
  • Użycie TensorFlow lub PyTorch do podstawowego modelowania sieci neuronowych
  • Sieci neuronowe do klasyfikacji i regresji

Prognozowanie Sprzedaży i Analiza Predykcyjna

  • Prognozowanie oparte na szeregach czasowych vs regresji
  • Obsługa danych sezonowych i trendowych
  • Budowanie modelu prognozowania sprzedaży przy użyciu technik uczenia maszynowego
  • Ocena dokładności prognozy i niepewności
  • Interpretacja biznesowa i komunikacja wyników

Uczenie Nienadzorowane

  • Techniki grupowania: k-średnich, k-medoidów, grupowanie hierarchiczne, SOM
  • Redukcja wymiarowości: PCA, analiza czynnikowa, SVD
  • Skalowanie wielowymiarowe

Eksploracja Tekstów

  • Wstępne przetwarzanie tekstu i tokenizacja
  • Model worek słów, stemming i lematyzacja
  • Analiza sentymentu i częstotliwość słów
  • Wizualizacja danych tekstowych za pomocą chmur słów

Systemy Rekomendacyjne

  • Filtrowanie kolaboratywne oparte na użytkownikach i przedmiotach
  • Projektowanie i ocena silników rekomendacyjnych

Eksploracja Wzorców Asocjacyjnych

  • Częste zbiory przedmiotów i algorytm Apriori
  • Analiza koszykowa i współczynnik liftu

Wykrywanie Wartości Odstających

  • Analiza skrajnych wartości
  • Metody oparte na odległości i gęstości
  • Wykrywanie wartości odstających w danych wielowymiarowych

Studium Przypadku Uczenia Maszynowego

  • Zrozumienie problemu biznesowego
  • Przetwarzanie wstępne danych i inżynieria cech
  • Wybór modelu i strojenie parametrów
  • Ocena i prezentacja wyników
  • Wdrożenie

Podsumowanie i Kolejne Kroki

Wymagania

  • Podstawowa wiedza na temat koncepcji uczenia maszynowego, takich jak uczenie nadzorowane i nienadzorowane
  • Znajomość programowania w Pythonie (zmienne, pętle, funkcje)
  • Doświadczenie w pracy z danymi przy użyciu bibliotek takich jak pandas lub NumPy jest pomocne, ale nie jest wymagane
  • Nie oczekuje się wcześniejszego doświadczenia z zaawansowanym modelowaniem lub sieciami neuronowymi

Grupa docelowa

  • Analitycy danych
  • Analitycy biznesowi
  • Inżynierowie oprogramowania i specjaliści techniczni pracujący z danymi
 28 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (2)

Propozycje terminów

Powiązane Kategorie