Bądźmy w kontakcie

Plan Szkolenia

Wprowadzenie

  • Uczenie się poprzez pozytywne wzmocnienie

Elementy Uczenia ze Wzmocnieniem

Ważne pojęcia (Działania, Stany, Nagrody, Polityka, Wartość, Q-Wartość itp.)

Przegląd metod rozwiązań tabelarycznych

Tworzenie agenta programowego

Zrozumienie podejść opartych na wartości, polityce i modelu

Praca z procesem decyzyjnym Markowa (MDP)

Jak polityki definiują sposób zachowania agenta

Stosowanie metod Monte Carlo

Uczenie się z różnicą czasową

n-krokowe bootstrapowanie

Przybliżone metody rozwiązań

Predykcja na zasadzie polityki z przybliżeniem

Kontrola na zasadzie polityki z przybliżeniem

Metody poza zasadą polityki z przybliżeniem

Zrozumienie śladów kwalifikacyjnych

Stosowanie metod gradientu polityki

Podsumowanie i zakończenie

Wymagania

  • Doświadczenie w uczeniu maszynowym
  • Doświadczenie w programowaniu

Grupa docelowa

  • Naukowcy zajmujący się danymi
 21 godzin

Liczba uczestników


Cena za uczestnika (netto)

Opinie uczestników (1)

Propozycje terminów

Powiązane Kategorie