本书以智能行为决策为主线,系统阐述了自主机器人在复杂动态环境下实现智能感知、自主规划和学习控制的理论基础与关键技术。全书共7章,内容涵盖自主机器人在感知、理解、规划、决策、控制、协同等方面的核心技术。第1章介绍了自主机器人的定义、特征、分类及发展历程,并分析了自主机器人面临的需求、挑战与发展趋势等。第2章探讨了机器人的感知与环境理解技术,包括视觉、力觉感知原理,多传感器融合感知,自主定位与建图,以及场景理解与语义地图构建。第3章系统阐述了自主决策的基础理论,如强化学习、深度强化学习、行为识别理论及人类反馈方法等。第4章和第5章分别讨论了移动机器人的自主路径规划与控制,以及机械臂的自主抓取与控制策略。其中,针对复杂动态环境,提出了改进的感知、规划与学习控制算法。第6章则专门探讨了智能人机交互与协作技术,重点分析了人体行为意图识别与预测方法,为实现自然、高效的人机协同提供了新思路。第7章介绍了自主机器人技术的系统应用与发展展望。
本书可供从事机器人、人工智能、模式识别、自动控制等领域的科研人员和工程技术人员参考,也可以作为相关专业高年级本科生和研究生的学习参考书。
第1章 绪论001
1.1 自主机器人的定义、特征及分类003
1.2 自主机器人的发展历程与研究现状005
1.3 自主机器人面临的需求、挑战与发展趋势006
1.4 自主机器人智能行为决策的内涵与意义007
参考文献009
第2章 机器人的感知与环境理解010
2.1 视觉、力觉感知的原理010
2.1.1 视觉感知原理010
2.1.2 力觉感知原理012
2.2 多传感器融合感知014
2.2.1 摄像机成像模型及坐标系转换014
2.2.2 相机标定019
2.2.3 多目视觉三维定位原理026
2.2.4 多目视觉立体匹配027
2.2.5 多相机信息融合策略029
2.3 机器人自主定位与建图技术030
2.3.1 视觉SLAM 系统030
2.3.2 ORB-SLAM3 系统039
2.3.3 同步定位与建图系统分析041
2.4 场景理解与语义地图构建043
2.4.1 动态特征剔除算法设计043
2.4.2 动态特征剔除算法测试054
2.4.3 环境语义地图构建算法设计055
2.4.4 环境语义地图构建算法测试063
参考文献066
第3章 自主决策的基础理论069
3.1 强化学习理论及方法069
3.1.1 强化学习理论069
3.1.2 不同模型状态下的强化学习方法074
3.1.3 基于策略的强化学习078
3.2 深度强化学习理论080
3.2.1 基于值函数的学习理论080
3.2.2 基于策略梯度的学习理论083
3.3 行为识别理论及方法086
3.3.1 监督学习基础理论086
3.3.2 基于深度学习的行为识别理论092
3.3.3 基于深度学习的行为识别方案098
3.4 人类反馈方法100
3.4.1 RLHF 算法100
3.4.2 PPO 算法103
参考文献105
第4章 移动机器人的自主路径规划与控制107
4.1 移动机器人运动学与动力学建模107
4.1.1 移动机器人运动学模型107
4.1.2 移动机器人动力学模型108
4.2 移动机器人控制系统搭建109
4.3 移动机器人自主导航与路径跟踪控制110
4.3.1 基于复杂动态环境下的SLAM 算法110
4.3.2 路径跟踪控制120
4.4 路径规划算法概述121
4.5 基于强化学习的路径规划方法123
4.5.1 改进的SAC 算法124
4.5.2 移动机器人路径规划设计131
4.5.3 移动机器人仿真环境设计136
参考文献148
第5章
机械臂的自主抓取与控制策略152
5.1 机械臂运动学与动力学建模152
5.1.1 机械臂运动学模型152
5.1.2 机械臂动力学模型157
5.2 机械臂自主抓取的感知、策略与规划160
5.2.1 移动物体感知系统160
5.2.2 机械臂自主抓取的策略167
5.2.3 机械臂自主抓取路径规划177
5.3 面向混叠环境的机械手自主抓取策略184
5.3.1 混叠目标检测技术184
5.3.2 基于改进SAC 算法的机械手抓取策略191
5.3.3 混叠环境下的抓取实验193
参考文献203
第6章 智能人机交互与协作204
6.1 多Kinect 传感器参数标定及误差分析204
6.1.1 Kinect 传感器系统204
6.1.2 坐标系变换213
6.1.3 Kinect 传感器误差分析219
6.2 人体行为动作数据特征处理219
6.2.1 人机协同场景设计220
6.2.2 人体行为动作数据收集223
6.2.3 动作行为数据预处理226
6.3 行为意图识别231
6.3.1 双流卷积神经网络及注意力机制231
6.3.2 基于注意力机制的行为识别网络设计233
6.3.3 行为识别实验及结果分析237
6.4 行为意图预测243
6.4.1 人体几何特征简化243
6.4.2 骨骼耦合基本判定248
6.4.3 特征选择与归类249
6.4.4 拉普拉斯评分算法250
6.4.5 ISODATA 253
6.4.6 融合骨骼耦合的LSTM 网络人体动作预测模型255
6.4.7 优化器256
6.5 面向人机协作的动作轨迹预测实验258
6.5.1 实验准备258
6.5.2 实验操作259
6.5.3 实验结果分析264
参考文献267
第7章 自主机器人技术的系统应用与发展展望269
7.1 机械臂自主抓取系统的应用与发展269
7.1.1 感知与环境理解在抓取中的集成应用269
7.1.2 深度强化学习驱动的抓取策略优化269
7.1.3 机械臂自主抓取技术的挑战与趋势270
7.2 人机协作系统的智能化应用271
7.2.1 大语言模型驱动的人机自然交互271
7.2.2 多模态感知下的人机意图理解272
7.2.3 自适应人机协作决策与控制273
7.3 智能物流与制造中的机器人应用273
7.3.1 多机器人协同的环境感知与导航273
7.3.2 基于语义理解的任务规划与执行274
7.3.3 智能物流与制造的技术创新方向275
7.4 机器人技术的跨域融合与创新277
7.4.1 感知-决策-控制的一体化架构277
7.4.2 自主学习与在线适应技术278
7.4.3 新型人工智能算法的应用探索279
7.5 机器人技术的发展趋势与展望280
7.5.1 关键技术的突破方向280
7.5.2 典型应用场景分析280
7.5.3 未来发展的机遇与挑战281