Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Zaawansowane techniki Reinforcement Learning
Wdrażanie modeli Reinforcement Learning
Eksploracja i eksploatacja
Wprowadzenie do Reinforcement Learning
Metody oparte na politykach
Q-Learning i sieci głębokie Q (DQNs)
Podsumowanie i następne kroki
Praca z OpenAI Gym
- Bilansowanie eksploracji i eksploatacji w modelach RL
- Strategie eksploracji: epsilon-greedy, softmax i inne
- Wprowadzenie do Q-learning
- Implementowanie DQNs przy użyciu TensorFlow
- Optymalizacja Q-learning z powtórnym przeżyciem i sieciami docelowymi
- Wieloagentowe uczenie wzmocnione
- Głęboki deterministyczny gradient polityki (DDPG)
- Optymalizacja polityki proximalnej (PPO)
- Algorytmy gradientów polityki
- Algorytm REINFORCE i jego implementacja
- Metody aktor-krytyka
- Zastosowania uczenia wzmocnionego w życiu rzeczywistym
- Integracja modeli RL w środowiskach produkcyjnych
- Konfiguracja środowisk w OpenAI Gym
- Symulowanie agentów w dynamicznych środowiskach
- Ocena wydajności agentów
- Co to jest uczenie wzmocnione?
- Kluczowe koncepcje: agent, środowisko, stany, działania i nagrody
- Wyzwania w uczeniu wzmocnionym
Wymagania
Grupa docelowa
- Specjaliści ds. nauki danych
- Specjaliści ds. uczenia maszynowego
- Badacze sztucznej inteligencji
- Doświadczenie w programowaniu Python
- Podstawowa znajomość pojęć uczenia głębokiego i uczenia maszynowego
- Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu z wzmocnieniem
28 godzin
Opinie uczestników (1)
Poziom szkolenia był na wysokim poziomie. Prowadzący nie bał się używać matematycznych formalizmów.