清华大学李升波教授的强化学习Tutorial Lecture
清华大学李升波教授的强化学习Tutorial Lecture
强化学习受生物学习行为启发,同时与最优控制和Trial and Error学习方法有着紧密联系。这份清华大学李升波教授的强化学习Lecture系统介绍了强化学习的基本概念,强化学习最优性条件、策略迭代与值迭代等基础知识。并通过介绍如何使用函数近似来表示值函数和策略,过渡到现代深度强化学习算法的讲解。最后,介绍了强化学习的一个具体落地方向:自动驾驶及课题组在这方面的系列成果,包含系统讲述强化学习的教材及强化学习开源软件GOPS。这份Lecture是开启强化学习之旅的不二选择,欢迎大家前来阅读😄!
看完这份强化学习Lecture,想要更深入更系统的学习强化学习?欢迎参考以下资料:
- 强化学习经典教材
- 主流强化学习算法代码实现