Dziękujemy za wysłanie zapytania! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Dziękujemy za wysłanie rezerwacji! Jeden z członków naszego zespołu skontaktuje się z Państwem wkrótce.
Plan Szkolenia
Wprowadzenie do uczenia przez wzmacnianie
- Czym jest uczenie przez wzmacnianie?
- Kluczowe pojęcia: agent, środowisko, stany, działania i nagrody
- Wyzwania w uczeniu przez wzmacnianie
Eksploracja i eksploatacja
- Równoważenie eksploracji i eksploatacji w modelach RL
- Strategie eksploracji: epsilon-zachłanne, softmax i inne
Q-Learning i głębokie sieci Q (DQNs)
- Wprowadzenie do Q-learningu
- Implementacja DQNs przy użyciu TensorFlow
- Optymalizacja Q-learningu z wykorzystaniem doświadczeń i sieci docelowych
Metody oparte na politykach
- Algorytmy gradientu polityki
- Algorytm REINFORCE i jego implementacja
- Metody aktor-krytyk
Praca z OpenAI Gym
- Konfiguracja środowisk w OpenAI Gym
- Symulowanie agentów w dynamicznych środowiskach
- Ocena wydajności agentów
Zaawansowane techniki uczenia przez wzmacnianie
- Uczenie przez wzmacnianie wielu agentów
- Głęboki deterministyczny gradient polityki (DDPG)
- Optymalizacja polityki proksymalnej (PPO)
Wdrażanie modeli uczenia przez wzmacnianie
- Rzeczywiste zastosowania uczenia przez wzmacnianie
- Integracja modeli RL w środowiskach produkcyjnych
Podsumowanie i kolejne kroki
Wymagania
- Doświadczenie w programowaniu w Pythonie
- Podstawowa znajomość koncepcji uczenia głębokiego i uczenia maszynowego
- Znajomość algorytmów i pojęć matematycznych stosowanych w uczeniu przez wzmacnianie
Grupa docelowa
- Naukowcy zajmujący się danymi
- Praktycy uczenia maszynowego
- Badacze sztucznej inteligencji
28 godzin
Opinie uczestników (1)
Dużo przykładów, interaktywny styl prowadzenia, odpowiedni czas na przerwy i rozwiązywanie zadań, gotowe maszyny ze środowiskiem i materiałami