Plan Szkolenia

Machine Learning

Wprowadzenie do Machine Learningu

  • Zastosowania uczenia maszynowego
  • Uczenie nadzorowane i niezakładane
  • Algorytmy uczenia maszynowego
    • Regresja
    • Klasyfikacja
    • Klasterowanie
    • Systemy rekomendacyjne
    • Wykrywanie anomalii
    • Uczenie wzmacniania

Regresja

  • Jednodzielna i wielodzielna regresja
    • Metoda najmniejszych kwadratów
    • Szacowanie współczynników
    • Ocena dokładności szacunków współczynników
    • Ocena dokładności modelu
    • Analiza po szacowaniu
    • Inne zagadnienia dotyczące modeli regresyjnych
    • Kwalifikatory jakościowe
    • Rozszerzenia liniowych modeli
    • Potencjalne problemy
    • Relacja między obciążeniem a wariancją (przeuczenie/niedouczenie) dla modeli regresyjnych

Metody przeprowadzania próbkowania

  • Cross-Validation
  • Metoda zbioru walidacyjnego
  • Cross-Validation z pominięciem jednego elementu
  • k-Krotna Cross-Validation
  • Relacja między obciążeniem a wariancją dla k-Krotnej Cross-Validation
  • The Bootstrap

Selekcja modeli i regularizacja

  • Selekcja podzbiorów
    • Najlepsza selekcja podzbiorów
    • Krokowe selekcje
    • Wybór optymalnego modelu
  • Metody zredukowania/regularizacji
    • Regresja grzbietowa (Ridge)
    • Lasso i Elastic Net
  • Selekcja parametru regularyzacyjnego
  • Metody redukcji wymiarowości
    • Regresja z analizą głównych składowych
    • Analyza częściowego najmniejszego kwadratu (Partial Least Squares)

Klasyfikacja

Regresja logistyczna

  • Funkcja kosztu modelu logistycznego
  • Szacowanie współczynników
  • Dokonywanie predykcji
  • Zależność odds ratio
  • Metryki oceny wydajności
    • Czułość/spezjficzność/PPV/NPV
    • Precyzja
    • Krzywa ROC
  • Wielodzielna regresja logistyczna
  • Regresja logistyczna dla >2 klas odpowiedzi
  • Regularizowana regresja logistyczna

Analyza dyskryminacyjna liniowa (LDA)

  • Korzystanie z twierdzenia Bayesa do klasyfikacji
  • Analyza dyskryminacyjna liniowa dla p=1
  • Analyza dyskryminacyjna liniowa dla p>1

Analyza dyskryminacyjna kwadratyczna (QDA)

K-Nearest Neighbors (KNN)

  • Klasyfikacja z nieliniowymi granicami decyzyjnymi

Maszyny wektorów nośnych (SVM)

  • Cel optymalizacyjny
  • Klasyfikator o maksymalnej marginesie
  • Kernel
  • Klasyfikacja typu one-vs-one
  • Klasyfikacja typu one-vs-all

Porównanie metod klasyfikacji

Głębokie uczenie (Deep Learning)

Wprowadzenie do głębokiego uczenia

Sztuczne sieci neuronowe (ANNs)

  • Biofizyczne neurony i sztuczne neurony
  • Nieliniowe hipotezy
  • Reprezentacja modelu
  • Przykłady i intuicje
  • Funkcja przenoszenia/aktywacji
  • Klasy typowych architektur sieci
    • Sieć neuronowa zwrotna (Feedforward ANN)
    • Złożone sieci zwrotne wielowarstwowe
  • Algorytm wstecznej propagacji błędu (Backpropagation)
  • Trening i zbieżność wstecznej propagacji błędu
  • Aproksymacja funkcji przy użyciu wstecznej propagacji błędu
  • Prawdziwe i projektowe zagadnienia dotyczące uczenia z użyciem wstecznej propagacji błędu

Głębokie uczenie

  • Sztuczna inteligencja i głębokie uczenie
  • Regresja softmax
  • Samouczenie się (Self-Taught Learning)
  • Głębokie sieci neuronowe
  • Demo i zastosowania

Laboratorium:

Rozpoczęcie pracy z R

  • Wprowadzenie do R
  • Podstawowe komendy i biblioteki
  • Manipulacja danymi
  • Importowanie i eksportowanie danych
  • Podsumowania graficzne i numeryczne
  • Pisanie funkcji

Regresja

  • Jednodzielna i wielodzielna regresja liniowa
  • Interakcyjne terminy
  • Nieliniowe przekształcenia
  • Regresja z zmiennymi kwalifikatorów jakościowych (dummy)
  • Cross-Validation i bootstrap
  • Metody selekcji podzbiorów
  • Kary za skomplikowane modele (Ridge, Lasso, Elastic Net)

Klasyfikacja

  • Regresja logistyczna, LDA, QDA i KNN
  • Próbkowanie i regularizacja
  • Maszyny wektorów nośnych (SVM)

Notatki:

  • Dla algorytmów ML, studia przypadków będą używane do omówienia ich zastosowań, zalet i potencjalnych problemów.
  • Analiza różnych zestawów danych będzie przeprowadzana przy użyciu R.

Wymagania

  • Podstawowa znajomość koncepcji statystycznych jest pożądana

Odbiorcy kursu

  • Data scientists
  • Inżynierowie uczenia maszynowego
  • Deweloperzy oprogramowania zainteresowani sztuczną inteligencją
  • Badacze pracujący nad modelowaniem danych
  • Profesjonalisci chętni do zastosowania uczenia maszynowego w biznesie lub przemyśle
 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (6)

Propozycje terminów

Powiązane Kategorie