Plan Szkolenia

Wstęp

Reinforcement Learning Podstawy

Podstawowe Reinforcement Learning Techniki

Wprowadzenie do JUTA

Konwergencja wartości i iteracja polityki

Kształtowanie nagród

Badanie

Uogólnienie

Częściowo obserwowalne MDP

Opcje

Logistyka

TD Lambda

Gradienty polityki

Głębokie Q-Learning

Tematy z teorii gier

Podsumowanie i kolejne kroki

Wymagania

  • Biegła znajomość języka Python
  • Zrozumienie rachunku prawdopodobieństwa i algebry liniowej
  • Podstawowe zrozumienie rachunku prawdopodobieństwa i Statistics
  • Doświadczenie w tworzeniu modeli uczenia maszynowego w Pythonie i Numpy

Publiczność

  • Deweloperzy
  • Naukowcy danych
 21 godzin

Liczba uczestników



Cena za uczestnika

Powiązane Kategorie