定 价:139 元
丛书名:信息技术和电气工程学科国际知名教材中译本系列
- 作者:[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas) 著 李宇超 译
- 出版时间:2024/4/1
- ISBN:9787302656449
- 出 版 社:清华大学出版社
- 中图法分类:O232
- 页码:284
- 纸张:
- 版次:1
- 开本:
-
商品库位:
本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和**控制来解决,但它们的精确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于**控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁。