|
关于我们
新书资讯 新书推荐 |
强化学习基本原理
本书深入探讨了单智能体和多智能体强化学习算法,系统介绍了多臂赌博机、马尔科夫决策过程、动态规划、基于值函数的强化学习算法、深度值函数算法、随机策略梯度算法、近端策略优化算法、深度确定性策略优化算法以及多智能体强化学习。这些主题既包括经典强化学习算法,也涵盖了近年来发展起来的深度强化学习算法。
你还可能感兴趣
我要评论
|