Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Plan Szkolenia
Wprowadzenie
- Uczenie się poprzez pozytywne wzmocnienie
Elements of Reinforcement Learning
Ważne pojęcia (działania, stany, nagrody, polityka, wartość, wartość Q itp.)
Przegląd metod rozwiązań tabelarycznych
Tworzenie agenta programowego
Zrozumienie podejść opartych na wartościach, zasadach i modelach
Praca z procesem decyzyjnym Markowa (MDP)
Jak polityki definiują sposób zachowania agenta
Korzystanie z metod Monte Carlo
Uczenie się różnic czasowych
n-krokowy Bootstrapping
Metody rozwiązań przybliżonych
Przewidywanie na podstawie polityki z aproksymacją
Kontrola polityki z aproksymacją
Metody poza polityką z aproksymacją
Zrozumienie śladów uprawnień
Korzystanie z metod gradientu polityki
Podsumowanie i wnioski
Wymagania
- Doświadczenie z uczeniem maszynowym
- Doświadczenie Programming
Uczestnicy
- Naukowcy zajmujący się danymi
21 godzin