Plan Szkolenia
Wprowadzenie
- Uczenie się poprzez pozytywne wzmocnienie
Elementy Uczenia ze Wzmocnieniem
Ważne pojęcia (Działania, Stany, Nagrody, Polityka, Wartość, Q-Wartość itp.)
Przegląd metod rozwiązań tabelarycznych
Tworzenie agenta programowego
Zrozumienie podejść opartych na wartości, polityce i modelu
Praca z procesem decyzyjnym Markowa (MDP)
Jak polityki definiują sposób zachowania agenta
Stosowanie metod Monte Carlo
Uczenie się z różnicą czasową
n-krokowe bootstrapowanie
Przybliżone metody rozwiązań
Predykcja na zasadzie polityki z przybliżeniem
Kontrola na zasadzie polityki z przybliżeniem
Metody poza zasadą polityki z przybliżeniem
Zrozumienie śladów kwalifikacyjnych
Stosowanie metod gradientu polityki
Podsumowanie i zakończenie
Wymagania
- Doświadczenie w uczeniu maszynowym
- Doświadczenie w programowaniu
Grupa docelowa
- Naukowcy zajmujący się danymi
Opinie uczestników (1)
Poziom szkolenia był na wysokim poziomie. Prowadzący nie bał się używać matematycznych formalizmów.