Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie do uczenia wzmacniającego
- Co to jest uczenie wzmacniające?
- Kluczowe pojęcia: agent, środowisko, stany, akcje i nagrody
- Wyzwania w uczeniu wzmacniającym
Eksploracja i wykorzystanie
- Zbilansowanie eksploracji i wykorzystania w modelach RL
- Strategie eksploracji: epsilon-greedy, softmax i inne
Q-Learning i sieci Q głębokie (DQNs)
- Wprowadzenie do Q-learning
- Implementowanie DQNs za pomocą TensorFlow
- Optymalizowanie Q-learning z wykorzystaniem odtwarzania doświadczeń i sieci docelowych
Metody oparte na politykach
- Algorytmy gradientów polityki
- Algorytm REINFORCE i jego implementacja
- Metody aktora-krytyka
Praca z OpenAI Gym
- Konfiguracja środowisk w OpenAI Gym
- Symulowanie agentów w dynamicznych środowiskach
- Ocenianie wydajności agenta
Zaawansowane techniki uczenia wzmacniającego
- Uczenie wzmacniające wieloagentowe
- Głębokie deterministyczne gradienty polityki (DDPG)
- Optymalizacja polityki bliskiej (PPO)
Wdrażanie modeli uczenia wzmacniającego
- Zastosowania uczenia wzmacniającego w rzeczywistym świecie
- Integracja modeli RL w środowiskach produkcyjnych
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie z programowaniem Python
- Podstawowa znajomość koncepcji uczenia głębokiego i uczenia maszynowego
- Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu wzmacniającym
Grupa docelowa
- Naukowcy danych
- Specjaliści od uczenia maszynowego
- Badacze sztucznej inteligencji
28 godzin
Opinie uczestników (1)
Poziom szkolenia był na wysokim poziomie. Prowadzący nie bał się używać matematycznych formalizmów.