Plan Szkolenia

Zaawansowane techniki Reinforcement Learning

Wdrażanie modeli Reinforcement Learning

Eksploracja i eksploatacja

Wprowadzenie do Reinforcement Learning

Metody oparte na politykach

Q-Learning i sieci głębokie Q (DQNs)

Podsumowanie i następne kroki

Praca z OpenAI Gym

  • Bilansowanie eksploracji i eksploatacji w modelach RL
  • Strategie eksploracji: epsilon-greedy, softmax i inne
  • Wprowadzenie do Q-learning
  • Implementowanie DQNs przy użyciu TensorFlow
  • Optymalizacja Q-learning z powtórnym przeżyciem i sieciami docelowymi
  • Wieloagentowe uczenie wzmocnione
  • Głęboki deterministyczny gradient polityki (DDPG)
  • Optymalizacja polityki proximalnej (PPO)
  • Algorytmy gradientów polityki
  • Algorytm REINFORCE i jego implementacja
  • Metody aktor-krytyka
  • Zastosowania uczenia wzmocnionego w życiu rzeczywistym
  • Integracja modeli RL w środowiskach produkcyjnych
  • Konfiguracja środowisk w OpenAI Gym
  • Symulowanie agentów w dynamicznych środowiskach
  • Ocena wydajności agentów
  • Co to jest uczenie wzmocnione?
  • Kluczowe koncepcje: agent, środowisko, stany, działania i nagrody
  • Wyzwania w uczeniu wzmocnionym

Wymagania

Grupa docelowa

  • Specjaliści ds. nauki danych
  • Specjaliści ds. uczenia maszynowego
  • Badacze sztucznej inteligencji
  • Doświadczenie w programowaniu Python
  • Podstawowa znajomość pojęć uczenia głębokiego i uczenia maszynowego
  • Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu z wzmocnieniem
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie