Plan Szkolenia
Wprowadzenie
- Uczenie się poprzez pozytywne wzmocnienie
Elements of Reinforcement Learning
Ważne pojęcia (działania, stany, nagrody, polityka, wartość, wartość Q itp.)
Przegląd metod rozwiązań tabelarycznych
Tworzenie agenta programowego
Zrozumienie podejść opartych na wartościach, zasadach i modelach
Praca z procesem decyzyjnym Markowa (MDP)
Jak polityki definiują sposób zachowania agenta
Korzystanie z metod Monte Carlo
Uczenie się różnic czasowych
n-krokowy Bootstrapping
Metody rozwiązań przybliżonych
Przewidywanie na podstawie polityki z aproksymacją
Kontrola polityki z aproksymacją
Metody poza polityką z aproksymacją
Zrozumienie śladów uprawnień
Korzystanie z metod gradientu polityki
Podsumowanie i wnioski
Wymagania
- Doświadczenie z uczeniem maszynowym
- Doświadczenie Programming
Uczestnicy
- Naukowcy zajmujący się danymi
Opinie uczestników (1)
Poziom szkolenia był na wysokim poziomie. Prowadzący nie bał się używać matematycznych formalizmów.