In this class I'm explaining the TRPO and PPO algorithms.
A new version of this video is now available here:
[ Ссылка ]
The corresponding slides are available here:
[ Ссылка ]
Useful links:
John Schulman's Deep RL bootcamp video about TRPO and PPO:
[ Ссылка ]
The arxiv insights video about PPO:
[ Ссылка ]
Ещё видео!