本书系统阐述无人艇集群智能决策领域的创新成果,提出“类脑记忆认知学习”架构。该架构通过模拟人脑记忆认知过程,构建“环境智能感知-场景交互认知-决策策略生成-决策虚实迁移”全链路无人艇集群智能决策系统:在环境智能感知阶段突破数据稀缺瓶颈,融合复杂环境数据增强与弱小目标检测技术;在场景交互认知阶段建立任务驱动的关系图谱与动态信用评估机制;在决策策略生成阶段提出知识-数据协同的递进式学习方法,实现离线优化与在线博弈的协同进化;在决策虚实迁移阶段提出虚实共享特征语义空间与多约束安全决策方法。全书以理论突破-技术实现-应用验证为主线,突出学科交叉融合与系统级创新双重特色。
更多科学出版社服务,请扫码获取。
1991.09-1998.02 天津工业大学机械系 本科、硕士
1998.03-2001.03 天津大学机械学院 博士2001.03至今 上海大学 博士后、讲师、副研究员、研究员
2005.04-2005.05 日本东京工业大学 客员研究员
2011.07-2012.07 美国新墨西哥州立大学 访问教授
2012.10-2014.10 加拿大多伦多大学 博士后智能载运国家自然科学基金杰青、重大、创新研究群体项目负责人,国家万人计划领军人才,上海领军人才、东方英才计划团队项目领衔人等。国家自然科学基金杰青、重大、创新研究群体项目负责人,国家万人计划领军人才,上海领军人才、东方英才计划团队项目领衔人等。
目录
第1章 无人艇集群智能决策架构概述 1
1.1 无人系统智能决策技术研究现状 2
1.1.1 基于知识驱动的逻辑学习方法 3
1.1.2 基于数据驱动的深度学习方法 4
1.1.3 基于行为驱动的强化学习方法 5
1.1.4 基于类脑记忆认知学习的智能决策 7
1.1.5 无人系统多元智能融合核心问题 7
1.2 基于类脑记忆认知学习的无人艇集群智能决策架构 8
1.2.1 环境智能感知方法 9
1.2.2 场景交互认知方法 9
1.2.3 决策策略生成方法 10
1.2.4 决策虚实迁移方法 11
1.3 各章关系结构 12
参考文献 13
第2章 无人艇集群环境智能感知方法 15
2.1 无人艇集群场景与目标数据增强 15
2.1.1 海上目标图像复杂环境增强 16
2.1.2 海上高价值目标图像增强 22
2.2 无人艇集群弱小目标智能感知 29
2.2.1 海上可见光图像弱目标感知 29
2.2.2 海上可见光图像小目标感知 35
2.2.3 激光点云图像弱目标感知 39
2.2.4 激光点云图像小目标感知 47
2.3 无人艇集群目标协同感知 53
2.3.1 多源目标协同感知 53
2.3.2 多模态目标协同感知 59
2.3.3 多源多模态目标协同感知 65
2.4 无人艇集群场景与目标理解 71
2.4.1 无人艇集群海上场景图生成 71
2.4.2 无人艇集群目标属性推理 75
2.4.3 无人艇集群目标行为语义理解 79
2.5 本章小结 85
参考文献 86
第3章 无人艇集群场景交互认知方法 92
3.1 协作场景感知与分析 93
3.1.1 单艇时序轨迹表征 94
3.1.2 单艇分布式场景感知 96
3.1.3 集群协作关系分析 99
3.1.4 集群场景协作感知 101
3.2 协作信息交互与共享 102
3.2.1 单艇场景语义建模 103
3.2.2 单艇交互信息表达 105
3.2.3 集群语义交互网络 106
3.2.4 集群协作信息共享 108
3.3 组内信用评估与优化 110
3.3.1 单艇动作价值表征 111
3.3.2 组内协作动作价值表征 114
3.3.3 集群组内信用评估 116
3.3.4 集群组内交互策略优化 118
3.4 本章小结 120
参考文献 120
第4章 无人艇集群决策策略生成方法 126
4.1 历史数据驱动的离线学习 127
4.1.1 演示数据生成与聚合 127
4.1.2 次优演示下的模仿学习 135
4.1.3 面向分布漂移的离线强化学习 140
4.2 在线策略学习与优化 146
4.2.1 离线到在线的稳定策略过渡 147
4.2.2 在线策略的新颖性探索 153
4.2.3 分布式加速优化架构 158
4.3 基于对手意图的博弈策略学习 167
4.3.1 对手意图建模 168
4.3.2 对手意图识别 173
4.3.3 组间竞争策略学习 176
4.4 基于关系图的博弈策略学习 177
4.4.1 异质关系图生成 177
4.4.2 局部–全局关系特征学习 181
4.4.3 无人艇集群协作–竞争混合策略学习 184
4.5 本章小结 185
参考文献 186
第5章 无人艇集群决策虚实迁移方法 193
5.1 虚实共享特征语义空间的构建 194
5.1.1 共享特征语义空间 194
5.1.2 文本特征语义空间 195
5.1.3 行为特征语义空间 196
5.1.4 多源特征语义空间的融合 197
5.2 虚实共享特征语义空间的泛化 200
5.2.1 虚实共享语义空间的域随机泛化 200
5.2.2 基于贝叶斯的艇域优化 202
5.2.3 融合集群任务的虚实表征泛化 203
5.3 虚实决策迁移 206
5.3.1 虚实决策一致性度量 206
5.3.2 虚实决策补偿 207
5.4 虚实迁移下的安全决策 208
5.4.1 多约束的安全决策 210
5.4.2 安全策略生成 212
5.5 迁移策略的稳定性优化 213
5.5.1 引入随机化扰动的稳定控制 214
5.5.2 多优化目标条件下权重自适应稳定控制 219
5.6 本章小结 221
参考文献 222