Plan Szkolenia

Wprowadzenie

  • Uczenie się poprzez pozytywne wzmocnienie

Elements of Reinforcement Learning

Ważne pojęcia (działania, stany, nagrody, polityka, wartość, wartość Q itp.)

Przegląd metod rozwiązań tabelarycznych

Tworzenie agenta programowego

Zrozumienie podejść opartych na wartościach, zasadach i modelach

Praca z procesem decyzyjnym Markowa (MDP)

Jak polityki definiują sposób zachowania agenta

Korzystanie z metod Monte Carlo

Uczenie się różnic czasowych

n-krokowy Bootstrapping

Metody rozwiązań przybliżonych

Przewidywanie na podstawie polityki z aproksymacją

Kontrola polityki z aproksymacją

Metody poza polityką z aproksymacją

Zrozumienie śladów uprawnień

Korzystanie z metod gradientu polityki

Podsumowanie i wnioski

Wymagania

  • Doświadczenie z uczeniem maszynowym
  • Doświadczenie Programming

Uczestnicy

  • Naukowcy zajmujący się danymi
 21 godzin

Liczba uczestników


cena netto za uczestnika

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie