Plan Szkolenia

Wprowadzenie do uczenia wzmacniającego

  • Co to jest uczenie wzmacniające?
  • Kluczowe pojęcia: agent, środowisko, stany, akcje i nagrody
  • Wyzwania w uczeniu wzmacniającym

Eksploracja i wykorzystanie

  • Zbilansowanie eksploracji i wykorzystania w modelach RL
  • Strategie eksploracji: epsilon-greedy, softmax i inne

Q-Learning i sieci Q głębokie (DQNs)

  • Wprowadzenie do Q-learning
  • Implementowanie DQNs za pomocą TensorFlow
  • Optymalizowanie Q-learning z wykorzystaniem odtwarzania doświadczeń i sieci docelowych

Metody oparte na politykach

  • Algorytmy gradientów polityki
  • Algorytm REINFORCE i jego implementacja
  • Metody aktora-krytyka

Praca z OpenAI Gym

  • Konfiguracja środowisk w OpenAI Gym
  • Symulowanie agentów w dynamicznych środowiskach
  • Ocenianie wydajności agenta

Zaawansowane techniki uczenia wzmacniającego

  • Uczenie wzmacniające wieloagentowe
  • Głębokie deterministyczne gradienty polityki (DDPG)
  • Optymalizacja polityki bliskiej (PPO)

Wdrażanie modeli uczenia wzmacniającego

  • Zastosowania uczenia wzmacniającego w rzeczywistym świecie
  • Integracja modeli RL w środowiskach produkcyjnych

Podsumowanie i kolejne kroki

Wymagania

  • Doświadczenie z programowaniem Python
  • Podstawowa znajomość koncepcji uczenia głębokiego i uczenia maszynowego
  • Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu wzmacniającym

Grupa docelowa

  • Naukowcy danych
  • Specjaliści od uczenia maszynowego
  • Badacze sztucznej inteligencji
 28 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie