Plan Szkolenia

Wprowadzenie do uczenia przez wzmacnianie

  • Czym jest uczenie przez wzmacnianie?
  • Kluczowe pojęcia: agent, środowisko, stany, działania i nagrody
  • Wyzwania w uczeniu przez wzmacnianie

Eksploracja i eksploatacja

  • Równoważenie eksploracji i eksploatacji w modelach RL
  • Strategie eksploracji: epsilon-zachłanne, softmax i inne

Q-Learning i głębokie sieci Q (DQNs)

  • Wprowadzenie do Q-learningu
  • Implementacja DQNs przy użyciu TensorFlow
  • Optymalizacja Q-learningu z wykorzystaniem doświadczeń i sieci docelowych

Metody oparte na politykach

  • Algorytmy gradientu polityki
  • Algorytm REINFORCE i jego implementacja
  • Metody aktor-krytyk

Praca z OpenAI Gym

  • Konfiguracja środowisk w OpenAI Gym
  • Symulowanie agentów w dynamicznych środowiskach
  • Ocena wydajności agentów

Zaawansowane techniki uczenia przez wzmacnianie

  • Uczenie przez wzmacnianie wielu agentów
  • Głęboki deterministyczny gradient polityki (DDPG)
  • Optymalizacja polityki proksymalnej (PPO)

Wdrażanie modeli uczenia przez wzmacnianie

  • Rzeczywiste zastosowania uczenia przez wzmacnianie
  • Integracja modeli RL w środowiskach produkcyjnych

Podsumowanie i kolejne kroki

Wymagania

  • Doświadczenie w programowaniu w Pythonie
  • Podstawowa znajomość koncepcji uczenia głębokiego i uczenia maszynowego
  • Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu przez wzmacnianie

Grupa docelowa

  • Naukowcy zajmujący się danymi
  • Praktycy uczenia maszynowego
  • Badacze sztucznej inteligencji
 28 godzin

Liczba uczestników


Cena za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie