Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Wprowadzenie do uczenia wzmacniającego
- Co to jest uczenie wzmacniające?
- Kluczowe pojęcia: agent, środowisko, stany, akcje i nagrody
- Wyzwania w uczeniu wzmacniającym
Eksploracja i wykorzystanie
- Zbilansowanie eksploracji i wykorzystania w modelach RL
- Strategie eksploracji: epsilon-greedy, softmax i inne
Q-Learning i sieci Q głębokie (DQNs)
- Wprowadzenie do Q-learning
- Implementowanie DQNs za pomocą TensorFlow
- Optymalizowanie Q-learning z wykorzystaniem odtwarzania doświadczeń i sieci docelowych
Metody oparte na politykach
- Algorytmy gradientów polityki
- Algorytm REINFORCE i jego implementacja
- Metody aktora-krytyka
Praca z OpenAI Gym
- Konfiguracja środowisk w OpenAI Gym
- Symulowanie agentów w dynamicznych środowiskach
- Ocenianie wydajności agenta
Zaawansowane techniki uczenia wzmacniającego
- Uczenie wzmacniające wieloagentowe
- Głębokie deterministyczne gradienty polityki (DDPG)
- Optymalizacja polityki bliskiej (PPO)
Wdrażanie modeli uczenia wzmacniającego
- Zastosowania uczenia wzmacniającego w rzeczywistym świecie
- Integracja modeli RL w środowiskach produkcyjnych
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie z programowaniem Python
- Podstawowa znajomość koncepcji uczenia głębokiego i uczenia maszynowego
- Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu wzmacniającym
Grupa docelowa
- Naukowcy danych
- Specjaliści od uczenia maszynowego
- Badacze sztucznej inteligencji
28 godzin
Opinie uczestników (1)
Poziom szkolenia był na wysokim poziomie. Prowadzący nie bał się używać matematycznych formalizmów.