要实现具有挑战性和复杂性的任务,需要将这些网络化多智能体系统形成一个有机的整体共同协调及协作来完成预定目标。大量文献将重心放在解决不同条件下的团队协作问题,但是所提方法并没有经过严密的理论推导。《多无人平台网络协同策略》旨在通过设计的一致性算法,提出并优化协同网络综合策略来实现团队协作。为此,《多无人平台网络协同策略》建立了协同控制无线网络机器人系统的模型框架。特别地,为解决网络中的一致性问题设计了两种新的控制算法:第一种算法利用最优控制理论和对应的HJB方程来解决,线性动态系统网络的一致性问题被正式定义并得到解决;第二种算法采用状态分解,将一致性问题转换为稳定性问题。
在第二种算法中,博弈理论用于解决严格协同框架下的一致性问题。为了获取协同优解,定义团队代价函数,并解决了相关的极值问题。与其他最优控制技术相比,在获得相同结果的条件下该算法具有更低的代价值。基于博弈论和分解技术的算法都用到了线性矩阵不等式并同时实现以下两点:一是寻求解决方案的分布式实现;二是控制器设计的一致性约束。此外,该书分析了协作团队在执行器异常(包含三种类型的故障)时的性能和稳定性,对稳态误差也进行了分析。算法在异常情况下的鲁棒性得到了仿真验证。最后,为了应对实际中更复杂的情况,提出了固定无向的网络拓扑结构。研究结果表明,只要服从随机切换结构和领导角色分配变化的网络,就可以实现网络稳定性和一致性。此外,通过引入附加条件,仍可以保证理想的性能指标。
《多无人平台网络协同策略》针对动态网络系统的一致性算法进行了深入研究,适用于所有对该领域感兴趣的研究人员、科学家和高年级大学生。
多传感器网络系统(无人网络系统)能够在无人参与的条件下实现长时间自主操作,近年来受到了人们越来越多的关注。目前被视为系统控制理论中具有战略意义的研究方向,吸引了大量的科技工作者对相关领域进行研究。人们对于多传感器网络系统的研究兴趣可能要追溯到某些特殊的应用场合,比如任务复杂或有其他限制,不允许直接人工干预(不安全或者会造成环境危害)。另外,自然界中动物在不需要明确管理者的条件下就能完成给定任务的群体行为,激发了科学家们的研究兴趣,从不同理论角度来实现协同网络。在鸟类迁移、鱼类寻找食物和其他有团队生活的动物身上都可以发现这样的例子。动物在没有外部监督的条件下,通过团队内部协作来执行复杂任务。此外,先进的无线通信网络已经可以连接一定数量并且分布在大面积区域的系统,为无人网络系统的构建奠定了基础。
这些先进的科技成果和观测结果,使科学家们专注于无人网络系统领域研究。无人网络系统的优势巨大,而且在各种领域的应用研究都已经相对成熟。相对于单个个体系统而言,无人网络系统的优势在于:能够增强整体的鲁棒性,提高仪器的敏感性和分辨率,降低操作成本和提高重构的自适应性能[13]。为了完成全新且具有挑战性的复杂任务,需要对这些任务进行网络分配,通过各单元间的协作来完成目标。这些网络的构建适用于多种动态系统,如无人机、无人车、无入水下航行器、人造卫星或移动机器人。这些系统通常都包括一定数量的传感器、决策器和执行器。因此,这是一种拥有大量传感器和决策器的网络(或称为“传感器一决策器一执行器”网络)。为了充分利用这些大型网络,需要满足一些前提条件。正如文献[119]中所讨论的那样,包括通信可靠性、最优功耗管理、安全、优化协同与团队协作等技术的发展。
要实现具有挑战性和复杂性的任务,需要将这些网络化多智能体系统形成一个有机的整体共同协调及协作来完成预定目标。大量文献将重心放在解决不同条件下的团队协作问题,但是所提方法并没有经过严密的理论推导。本书旨在通过设计最优的一致性算法,提出并优化协同网络综合策略来实现团队协作。为此,本书建立了协同控制无线网络机器人系统的模型框架。特别地,为解决网络中的一致性问题设计了两种新的控制算法:第一种算法利用最优控制理论和对应的HJB方程来解决,线性动态系统网络的一致性问题被正式定义并得到解决;第二种算法采用状态分解,将一致性问题转换为稳定性问题。
在第二种算法中,博弈理论用于解决严格协同框架下的一致性问题。为了获取协同最优解,定义团队代价函数,并解决了相关的极值问题。与其他最优控制技术相比,在获得相同结果的条件下该算法具有更低的代价值。基于博弈论和分解技术的算法都用到了线性矩阵不等式并同时实现以下两点:一是寻求解决方案的分布式实现;二是控制器设计的一致性约束。此外,本书分析了协作团队在执行器异常(包含三种类型的故障)时的性能和稳定性,对稳态误差也进行了分析。算法在异常情况下的鲁棒性得到了仿真验证。最后,为了应对实际中更复杂的情况,提出了固定无向的网络拓扑结构。研究结果表明,只要服从随机切换结构和领导角色分配变化的网络,就可以实现网络稳定性和一致性。此外,通过引入附加条件,仍可以保证理想的性能指标。
本书针对动态网络系统的一致性算法进行了深入研究,适用于所有对该领域感兴趣的研究人员、科学家和高年级大学生。本书的大部分资助基金来自于加拿大自然科学和工程研究理事会(NSERC)。同时,本书的第二作者衷心地感谢他作为康科迪亚大学一级研究员得到的基金资助,以及来自工程和计算机科学学院的支持。
第1章 绪论
1.1 研究动机
1.2 应用实例
1.3 文献综述
1.3.1 编队控制
1.3.2 基于群集行为/分群的解决方案
1.3.3 一致性算法
1.4 问题陈述
1.5 本书内容安排
第2章 基础理论
2.1 多智能体系统的网络
2.2 信息结构和邻近集合
2.2.1 无领航结构
2.2.2 改进的领航者一跟随者结构
2.2.3 环形拓扑结构
2.3 团队成员之间的交互模型
2.4 成员的动态模型
2.4.1 二重积分动态模型
2.4.2 线性动态模型
2.5 术语和定义
2.6 执行机构的故障类型
2.7 哈密顿-雅可比-贝尔曼方程
2.8 线性二次调节器问题中的线性矩阵不等式方程
2.9 协同博弈理论
2.10 问题陈述:多智能体团队系统的一致性
第3章 半分布式最优一致性策略
3.1 最优控制问题的公式化
3.1.1 代价函数的定义
3.1.2 一致性搜索问题的HJB方程
3.2 情况Ⅰ:带有二重积分动态模型的多智能体团队系统
3.2.1 无领航者多运载器团队中的一致性问题
3.2.2 MLF模式下多运载器团队的一致性问题
3.3 情况Ⅱ:具有线性动态模型的多智能体团队系统
3.3.1 MLF模式下多运载器团队中的一致性问题
3.3.2 无领航多运载器团队中的一致性问题
3.4 仿真结果
3.4.1 二重积分动态模型
3.4.2 线性动态模型
3.5 结论
第4章 非理想条件下的半分布式最优团队协同
4.1 执行机构出现故障时的团队行为
4.1.1 成员执行机构失效情况下的团队行为
4.1.2 成员执行机构漂移故障时的团队行为
4.1.3 成员定点锁定故障约束下的团队行为
4.1.4 无领航结构
4.2 网络结构的改变
4.2.1 切换控制输入和稳定性分析
4.2.2 R的选择标准:性能和控制效果的权衡
4.3 仿真结果
4.3.1 执行机构故障对团队性能的影响
4.3.2 可切换拓扑网络中的团队性能
4.4 结论
第5章 线性矩阵不等式在团队协同中的应用
5.1 基于协同博弈理论的一致性求解方法
5.1.1 问题表述
5.1.2 最小化问题的解决方案:LMI配方
5.1.3 获得纳什议价解的算法
5.2 基于LMI的一致性求解方法
5.2.1 状态分解
5.2.2 最优控制设计
……
第6章 结论与未来工作展望
附录A
参考文献