Lessons from alphazero for optimal, model predictive, and adaptive control_Dimitri P. Bertsekas_9787302684718

Lessons from alphazero for optimal, model predictive, and adaptive control

定　　价：79 元

丛书名：国际知名大学原版教材

作者：Dimitri P. Bertsekas
出版时间：2025/4/1
ISBN：9787302684718
出版社：清华大学出版社

中图法分类：TP181
页码：xiv, 227页
纸张：
版次：影印版
开本：24cm
商品库位：

内容简介

本书构建了近似动态规划和强化学习的新的理论框架, 简洁但雄心勃勃。这一框架以离线训练和在线学习这两个算法为中心, 彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩。在看似纷繁复杂的数据与算法表象之下, 其实蕴藏着简洁而美妙的规律。通过本书的学习, 读者将能体会经典优化控制理论在分析理解当代强化学习算法性能中的强大威力, 更能领悟到以阿尔法零为代表的新一代算法浪潮对经典理论提供的新的发展机遇。

你还可能感兴趣

机器学习中的监督与无监督学习--模型、算法与应用
深入理解PyTorch
深度学习与安全对抗
深度学习框架应用开发
机器学习线性代数基础：Python语言描述

我要评论