平均场随机线性二次最优控制与时间不一致的随机线性二次最优控制是控制界研究的热点问题。本书针对平均场控制中定号与不定号、有限与无限时域等不同情形,提出了基于算子理论、Riccati方程及其推广的系统方法,刻画了最优控制的存在性、唯一性及解析形式;进而探讨了非指数折扣、非线性期望与时间依赖性等因素导致的时间不一致性问题,引入了开环均衡控制、混合均衡策略、自协调控制等概念,并构建了虚构博弈与两层博弈等分析框架,有效应对均衡解的时间一致性缺失问题。书中理论研究贯穿多个实际背景,如均值-方差投资组合管理与Stackelberg博弈等。
更多科学出版社服务,请扫码获取。
1997年9月-2001年7月,曲阜师范大学,学士
2001年9月-2004年7月,西安交通大学,硕士
2007年9月-2010年7月,中国科学院数学与系统科学研究院,博士2017年1月至今,南开大学
2013年6月-2017年1月,中国科学院系统科学研究所,博士后
2014年5月-2015年5月,美国加州大学(圣地亚哥),访问学者
2016年5月-2017年1月,香港理工大学,博士后最优控制、随机控制、强化学习System & Control Letters,Associate Editor
目录
编者的话
前言
主要符号说明
第1章 绪论 1
1.1 最优控制浅谈 1
1.2 平均场最优控制 3
1.2.1 平均场控制的内涵 3
1.2.2 相关研究进展 5
1.3 时间不一致的最优控制 7
1.3.1 时间不一致性的内涵 7
1.3.2 相关研究进展 8
1.3.3 斯塔克尔伯格博弈的时间不一致性 10
1.4 本书主要内容 12
第2章 平均场随机线性二次最优控制:定号有限时域情形 16
2.1 问题描述 16
2.2 问题抽象刻画 17
2.3 基于Riccati方程的闭环最优控制 21
2.3.1 线性反馈控制公式 22
2.3.2 线性二次最优控制 28
2.3.3 基于配方法的最优控制 38
2.4 数值例子 40
2.5 本章小结 42
第3章 平均场随机线性二次最优控制:定号无限时域情形 43
3.1 问题描述 43
3.2 平均场随机差分方程的稳定性与镇定性 44
3.3 无限时域平均场随机线性二次问题 48
3.4 代数Riccati方程的非负定解 53
3.4.1 代数Riccati方程的最小非负定解 53
3.4.2 最大解和镇定解 55
3.4.3 最小非负定解和镇定解 65
3.5 本章小结 69
第4章 平均场随机线性二次最优控制:不定号有限时域情形 70
4.1 问题描述 70
4.2 递推法求解 73
4.3 基于极大值原理的求解方法 88
4.4 多周期投资组合 102
4.5 数值例子 109
4.6 本章小结 111
第5章 平均场随机线性二次最优控制:不定号无限时域情形 112
5.1 问题描述 112
5.2 广义代数Riccati方程与最优控制 113
5.3 数值例子 124
5.4 本章小结 126
第6章 时间不一致的随机线性二次最优控制:开环均衡解 127
6.1 问题描述 127
6.2 对应固定初始对的问题 129
6.3 对应所有初始对的问题 147
6.4 多周期均值-方差投资组合问题 152
6.5 本章小结 156
第7章 时间不一致的随机线性二次最优控制:混合均衡解 157
7.1 问题描述 157
7.2 对应固定初始对的问题 161
7.3 对应所有初始对的问题 182
7.4 多周期均值-方差投资组合问题 196
7.5 数值例子 205
7.6 本章小结 214
第8章 时间不一致的随机线性二次最优控制:开环自调和控制 215
8.1 问题描述 216
8.2 开环自调和控制 222
8.3 多周期均值-方差投资组合问题 229
8.4 证明 237
8.4.1 定理8.1的证明 237
8.4.2 定理8.2的证明 242
8.5 本章小结 253
第9章 确定性线性二次斯塔克尔伯格博弈的开环均衡解 255
9.1 开环斯塔克尔伯格解的时间不一致性 256
9.2 开环均衡解的定义 260
9.3 开环均衡解的刻画 262
9.4 关于开环均衡解的时间一致性 275
9.5 数值例子 277
9.6 本章小结 278
参考文献 279