本书以无人机作为无人系统的典型代表,以强化学习作为理论工具,分别对路径规划、目标跟踪、单机空战机动、多机协同空战机动、空战多域决策、集群任务协同等任务背景下的自主决策问题展开分析研究,涵盖了强化学习中模糊强化学习、深度强化学习、分层强化学习、多智能体强化学习等主要细分方向在无人系统自主决策具体任务场景下的应用研究。
聚焦无人系统代表无人机与强化学习理论结合,精准定位关键技术融合应用领域,具有前沿性与创新性。
全面覆盖多类任务背景下自主决策问题研究,从路径规划到集群任务协同,为无人系统在复杂场景应用提供全面解决方案。
深度探索强化学习各主要细分方向在无人系统具体任务场景的应用,无论是模糊、深度、分层还是多智能体强化学习,均有涉及,为相关领域研究与实践提供丰富且深入的参考依据与技术指导。
第1章绪论
1.1引言
1.2无人作战系统
1.2.1空中无人作战系统
1.2.2地面无人作战系统
1.2.3海上无人作战系统
1.3无人作战系统发展趋势
1.4强化学习与无人系统
第2章强化学习理论
2.1强化学习的概念
2.1.1基本概念
2.1.2强化学习的要素
2.2马尔可夫决策过程
2.2.1定义
2.2.2基于值函数的求解方法
2.2.3基于策略的求解方法
2.3部分可观测的马尔可夫决策过程
2.3.1定义
2.3.2求解方法
2.4深度强化学习
2.4.1定义
2.4.2主要算法框架
2.5分层强化学习
2.5.1半马尔可夫决策过程
……