本书为“十二五”普通高等教育本科国家级规划教材和北京高等教育精品教材。全书包括8章和附录,主要内容包括绪论、确定性知识系统、不确定性知识系统、智能搜索技术、机器学习、深度学习、强化学习和智能体应用。附录A是新一代人工智能简介。本书为任课教师免费提供电子课件、源代码、习题解答等资源,可在“华信教育资源网”免费下载。本书可以作为高等院校计算机类相关专业的教材。
苏松志,现任厦门大学信息学院副教授、硕士生导师,主要从事计算机视觉与机器学习应用研究,主持国家自然科学基金等科研项目,在智能医疗装备、无人驾驶视觉技术领域取得创新成果。
目 录
第1章 绪论 1
1.1 人工智能的产生与发展 2
1.1.1 形成期(1956年到20世纪60年代末) 2
1.1.2 知识应用期(20世纪70年代初到20世纪80年代初) 3
1.1.3 从学派分立走向综合(20世纪80年代中到21世纪初) 4
1.1.4 机器学习和深度学习引领发展(21世纪初至今) 5
1.2 人工智能的计算方法 5
1.2.1 符号主义 5
1.2.2 连接主义 6
1.2.3 行为主义 6
1.3 人工智能的架构与系统 7
1.3.1 智能计算的软硬件框架 7
1.3.2 人工智能的计算芯片 8
1.3.3 人工智能的编程框架 9
1.4 人工智能的应用领域 11
1.4.1 机器思维 11
1.4.2 机器学习 12
1.4.3 机器感知 14
1.4.4 机器行为 15
1.4.5 计算智能 16
1.4.6 分布式人工智能 17
1.4.7 智能系统 18
1.4.8 人工心理和人工情感 18
1.4.9 人工智能的典型应用 19
1.5 本书内容的相互关系 22
习题1 23
第2章 确定性知识系统 24
2.1 确定性知识系统概述 24
2.1.1 确定性知识表示概述 24
2.1.2 确定性知识推理概述 26
2.2 确定性知识表示方法 28
2.2.1 谓词逻辑表示法 28
2.2.2 产生式表示法 35
2.2.3 语义网络表示法 37
2.2.4 框架表示法 43
2.3 确定性知识推理方法 47
2.3.1 产生式推理 47
2.3.2 自然演绎推理 52
2.3.3 归结演绎推理 56
2.4 确定性知识系统简例 64
2.4.1 产生式系统简例 64
2.4.2 归结演绎系统简例 66
2.5 知识图谱的表示与推理 68
2.5.1 知识图谱概述 68
2.5.2 知识图谱的路径排序推理方法 68
2.5.3 知识图谱与大语言模型的结合 70
习题2 71
第3章 不确定性知识系统 74
3.1 不确定性推理概述 74
3.1.1 不确定性推理的含义 74
3.1.2 不确定性推理的基本问题 75
3.1.3 不确定性推理的类型 76
3.2 可信度推理 77
3.2.1 可信度的概念 77
3.2.2 可信度推理模型 77
3.2.3 可信度推理的例子 81
3.3 主观贝叶斯推理 82
3.3.1 主观贝叶斯方法的概率论基础 82
3.3.2 主观贝叶斯方法的推理模型 83
3.3.3 主观贝叶斯推理的例子 87
3.3.4 主观贝叶斯推理的特性 89
3.4 证据理论 89
3.4.1 证据理论的形式化描述 90
3.4.2 证据理论的推理模型 94
3.4.3 推理实例 95
3.4.4 证据理论推理的特性 97
3.5 概率推理 97
3.5.1 贝叶斯网络的概念及理论 97
3.5.2 贝叶斯网络推理的概念和类型 101
3.5.3 贝叶斯网络的精确推理 101
3.5.4 贝叶斯网络的近似推理 103
习题3 104
第4章 智能搜索技术 107
4.1 搜索概述 107
4.1.1 搜索的含义 107
4.1.2 状态空间法 108
4.1.3 问题归约法 111
4.1.4 进化搜索算法概述 114
4.2 状态空间启发式搜索 117
4.2.1 启发性信息和估价函数 117
4.2.2 A算法 118
4.2.3 A*算法 120
4.2.4 A*算法应用举例 124
4.3 与/或树启发式搜索 125
4.3.1 解树的代价与希望树 125
4.3.2 与/或树启发式搜索过程 126
4.4 博弈树启发式搜索 128
4.4.1 博弈概述 128
4.4.2 极大/极小过程 129
4.4.3 α-β?剪枝 130
4.5 遗传算法 131
4.5.1 遗传算法中的基本概念 131
4.5.2 遗传算法的基本过程 131
4.5.3 遗传编码算法 132
4.5.4 适应度函数 134
4.5.5 基本遗传操作 135
4.5.6 遗传算法应用简例 140
4.6 蒙特卡罗树搜索 143
4.6.1 基本思路 143
4.6.2 优缺点分析 144
习题4 146
第5章 机器学习 148
5.1 什么是机器学习 148
5.1.1 数据 149
5.1.2 模型 149
5.1.3 损失函数 150
5.1.4 优化算法 151
5.1.5 应用 151
5.2 线性回归模型 152
5.2.1 线性回归及最小二乘法 152
5.2.2 概率模型及极大似然估计 152
5.2.3 最大后验概率与正则化线性回归 154
5.3 线性分类模型 155
5.3.1 模型 155
5.3.2 损失函数 155
5.3.3 优化算法 156
5.3.4 应用 157
5.4 支持向量机 157
5.4.1 模型 157
5.4.2 损失函数 158
5.4.3 优化算法 159
5.4.4 应用 161
5.5 决策树 161
5.5.1 模型 161
5.5.2 损失函数 162
5.5.3 优化算法 163
5.5.4 应用 164
5.6 AdaBoost 164
5.6.1 模型 164
5.6.2 损失函数 164
5.6.3 优化算法 165
5.6.4 应用 166
5.7 朴素贝叶斯模型 166
5.7.1 模型 167
5.7.2 损失函数 167
5.7.3 优化算法 168
5.7.4 应用 169
5.7.5 算法简例 169
5.8 混合高斯模型 170
5.8.1 模型 170
5.8.2 损失函数 170
5.8.3 优化算法 171
5.8.4 应用 172
5.9 概率主成分分析 172
5.9.1 模型 172
5.9.2 损失函数 173
5.9.3 优化算法 173
5.9.4 应用 173
习题5 173
第6章 深度学习 175
6.1 简史 175
6.1.1 萌芽期 175
6.1.2 冰河期 175
6.1.3 复兴期 176
6.1.4 低谷期 176
6.1.5 崛起期 176
6.2 前馈神经网络 177
6.2.1 神经元 177
6.2.2 模型 178
6.2.3 训练 179
6.3 卷积神经网络 180
6.3.1 模型 180
6.3.2 训练 183
6.3.3 常见的网络结构 184
6.4 循环神经网络 186
6.4.1 模型 186
6.4.2 训练 187
6.4.3 常见的循环神经网络 188
6.5 Transformer 190
6.5.1 自注意力机制 191
6.5.2 输入层 191
6.5.3 编码层 192
6.5.4 解码层 192
6.6 深度生成式模型 193
6.6.1 流模型 194
6.6.2 自回归生成模型 196
6.6.3 生成对抗网络 198
6.6.4 变分自编码器 199
6.6.5 扩散概率模型 201
习题6 204
第7章 强化学习 205
7.1 问题描述 206
7.1.1 典型例子 206
7.1.2 问题的定义 206
7.1.3 目标函数 207
7.2 基于值函数的方法 210
7.2.1 动态规划 210
7.2.2 蒙特卡罗方法 212
7.2.3 时序差分方法 213
7.2.4 深度Q网络 214
7.3 基于策略函数的方法 216
7.3.1 策略梯度 216
7.3.2 REINFORCE 217
7.3.3 PPO算法 218
7.3.4 基于人类反馈的强化学习 219
7.4 演员-评论员算法 220
习题7 222
第8章 智能体应用 223
8.1 大语言模型概述 223
8.1.1 大语言模型发展简史 223
8.1.2 大语言模型的训练过程 224
8.1.3 大语言模型上下文协议 226
8.2 智能体的定义与分类 227
8.2.1 智能体的定义 227
8.2.2 反思型智能体 227
8.2.3 工具使用智能体 228
8.2.4 规划智能体 229
8.2.5 多智能体协同 229
8.3 提示词工程 230
8.4 思维链技术 231
8.5 检索增强生成 232
习题8 234
附录A 新一代人工智能简介 235
A.1 新一代人工智能基础理论简介 235
A.2 新一代人工智能关键共性技术简介 238
参考文献 241