以 ChatGPT 和 DeepSeek 为代表的大模型,标志着人工智能在理解和处理世界知识方面取得了显著的进展。知识增强(Knowledge Augmentation)是指在大模型训练或推理过程中,通过引入外部结构化知识或符号化知识,提升大模型在理解、推理与生成等任务中的准确性、可靠性、专业性和可解释性。本书聚焦于“大模型+知识库(LLM + KB)”框架下的大模型知识增强机制与方法,特别是系统探讨大模型与知识图谱互补增强的核心技术与实现路径。具体内容涵盖:大模型知识增强概述、知识增强预训练基础、知识增强提示指令、知识辅助检索增强、知识增强大模型查询问答、知识增强推理、大模型幻觉抑制、知识编辑、知识增强多模态学习,以及知识智能体与世界模型等主题。各章由浅入深,先提供背景知识,再逐步深入介绍技术原理和最新学术进展,注重系统性、整体性与章节间的有机衔接。针对实践应用,本书部分章节挑选了来自企业真实案例与开源工具的示范,便于读者动手实践,实现理论与实践的结合。本书可作为计算机及相关专业的高年级本科生、研究生教材,也可作为从事大模型相关工作的技术管理者与研发人员的参考书。
陈华钧浙江大学计算机科学与技术学院教授/博导,中文开放知识图谱OpenKG发起人,浙江省数智科技研究会副会长,中国中文信息学会语言与知识计算专委会副主任,中国人工智能学会知识工程与分布智能专委会副主任。入选浙江省有突出贡献中青年专家、浙江省高层次人才特殊支持计划科技创新领军人才,全球前2%顶尖科学家终身榜单(人工智能领域)。主要研究方向为人工智能、知识图谱、自然语言处理、AI for Science,在Nature Machine Intelligence、Nature Communications、NeurIPS、ICLR、ICML、IJCAI、AAAI、ACL、EMNLP、WWW、KDD、VLDB、IEEE TKDE、Proceedings of the IEEE等国际顶级会议和期刊以第一作者或通讯作者发表多篇论文。主持多项国家自然科学基金重点类项目,以及国家重点研发计划、国家重大科技专项、重大企业合作项目。曾获国际语义网会议ISWC最佳论文奖、国际知识图谱联合会议IJCKG最佳论文奖、国家科技进步二等奖、教育部技术发明一等奖、钱伟长科技奖一等奖、浙江省科技进步二等奖、浙江大学优秀教材奖一等奖等多项科技奖励。张宁豫浙江大学软件学院副教授、特聘研究员、智能科学与工业软件所副所长,入选斯坦福全球前2%顶尖科学家榜单,主要研究方向为自然语言处理、知识图谱等。担任ACM Transactions on Asian and Low-Resource Language Information Processing Associate Editor,ACL、EMMLP、ICLR、KDD领域主席,ARR Action Editor,IJCAI高级程序委员,研发了知识获取系统DeepKE及大模型知识编辑系统EasyEdit。张文浙江大学软件学院副教授、特聘研究员。研究方向为知识表示与推理、知识图谱、大语言模型。在NeurIPS、KDD、WWW、IJCAI、AAAI、ICDE、ACM MM、WSDM等国际顶级会议上发表多篇论文。主持国家自然科学基金青年科学基金项目、浙江省自然科学基金探索青年项目、宁波市自然科学基金探索一般项目。曾获国际知识图谱联合会议(IJCKG)最佳论文奖、最佳应用论文奖,浙江省科技进步二等奖等奖励。入选副省级市高层次人才引进计划、百度2023年度AI华人女性青年学者榜。
第1章 大模型知识增强概述 1
1.1 大模型时代的通用人工智能 2
1.1.1 人类语言与世界知识 2
1.1.2 大模型是处理世界知识的通用
人工智能系统 2
1.1.3 通用人工智能的特征 3
1.2 大模型的知识力 8
1.2.1 什么是知识 8
1.2.2 知识的表示形式 9
1.2.3 大模型中的世界知识 11
1.3 知识图谱与语言模型 14
1.3.1 知识表示与知识规模 15
1.3.2 为什么仍然需要符号知识图谱 16
1.3.3 语言模型与知识图谱都是表示和处理
知识的手段 16
1.4 大模型知识增强 17
1.4.1 大模型知识增强的分类 17
1.4.2 大模型知识增强的典型方法及核心概念 20
1.5 本章小结 21
第2章 知识增强预训练基础 23
2.1 知识增强预训练概述 24
2.2 预训练语言模型 25
2.2.1 语言模型 25
2.2.2 词向量与分布式语义表示 26
2.2.3 注意力机制:增强词的交互关系 28
2.2.4 预训练语言模型 29
2.2.5 ChatGPT 31
2.3 知识增强的预训练 34
2.3.1 常见知识增强语料 34
2.3.2 知识增强词向量 36
2.3.3 知识注入 37
2.3.4 结构增强 43
2.4 应用与实践 47
2.4.1 知识增强电信预训练模型 47
2.4.2 知识增强电商预训练模型 53
2.4.3 知识增强蛋白质预训练模型 56
2.5 本章小结 59
第3章 知识增强提示指令 60
3.1 知识增强提示指令概述 61
3.2 提示学习与指令精调 63
3.2.1 提示学习 63
3.2.2 指令精调 69
3.2.3 思维链 73
3.2.4 提示的本质 74
3.3 知识增强提示学习 76
3.3.1 传统提示学习的局限性 76
3.3.2 知识增强提示模板 76
3.3.3 知识增强标签词集构建 79
3.3.4 面向图数据的提示学习 81
3.4 结构增强思维链 83
3.4.1 传统思维链的局限性 83
3.4.2 结构化思维链 84
3.4.3 知识图谱思维链 91
3.5 结构增强指令精调 93
3.5.1 传统指令精调的局限性 93
3.5.2 知识抽取指令 94
3.5.3 图学习指令 97
3.5.4 知识图谱指令 99
3.6 本章小结 100
第4章 知识辅助检索增强 103
4.1 知识辅助检索增强概述 104
4.2 检索增强生成 105
4.2.1 什么是检索增强生成 105
4.2.2 RAG的典型架构 108
4.2.3 RAG的训练机制 111
4.2.4 RAG的优化 114
4.2.5 RAG的局限性 114
4.3 知识图谱与RAG 115
4.3.1 向量RAG与KG-RAG 115
4.3.2 知识图谱对于RAG的价值 116
4.3.3 知识图谱增强RAG的不同阶段 118
4.4 KG-RAG的几种典型架构 121
4.4.1 Tree-RAG:构建实体或主题
概念树增强RAG 121
4.4.2 KE-RAG:利用知识抽取增强RAG 122
4.4.3 利用外部知识图谱增强的KG-RAG 125
4.4.4 融合思维链的多模态KG-RAG 126
4.5 本章小结 127
第5章 知识增强大模型查询问答 129
5.1 知识增强大模型查询问答概述 130
5.2 查询问答背景知识 131
5.2.1 结构化知识表示 131
5.2.2 结构化知识查询 132
5.2.3 查询问答方法 135
5.3 大模型查询问答能力分析 137
5.4 知识增强查询问答方法 138
5.4.1 基于大模型微调的查询问答 138
5.4.2 基于检索生成的查询问答 139
5.4.3 基于统一表示的查询问答 142
5.5 本章小结 144
第6章 知识增强大模型推理 146
6.1 知识增强大模型推理概述 147
6.2 知识推理背景介绍 148
6.2.1 什么是知识推理 148
6.2.2 语言模型推理 153
6.2.3 知识图谱推理 156
6.2.4 知识增强大模型推理的目标 162
6.3 知识图谱增强语言模型推理 163
6.3.1 知识图谱引导多跳推理链 163
6.3.2 符号规则引导大模型推理 166
6.3.3 知识图谱过程监督 170
6.4 语言模型增强知识图谱推理 172
6.4.1 语言模型增强知识图谱查询推理 173
6.4.2 语言模型增强知识图谱关系推理 175
6.4.3 语言模型增强知识图谱规则推理 177
6.5 知识图谱基础模型 179
6.5.1 知识图谱预训练方法 180
6.5.2 知识图谱基础模型初探 183
6.6 本章小结 186
第7章 知识增强幻觉抑制 188
7.1 知识增强幻觉抑制概述 189
7.2 大模型幻觉背景 190
7.2.1 大模型幻觉问题定义 190
7.2.2 大模型幻觉成因 192
7.2.3 大模型幻觉检测与抑制意义 193
7.2.4 知识增强与幻觉抑制 194
7.3 大模型幻觉检测与抑制 194
7.3.1 幻觉问题检测方法 195
7.3.2 知识增强幻觉抑制 199
7.4 本章小结 206
第8章 大模型知识编辑 208
8.1 大模型知识编辑概述 209
8.2 大模型知识编辑问题 210
8.2.1 什么是大模型知识编辑 210
8.2.2 大模型知识分析方法 212
8.2.3 大模型知识存储机制 214
8.3 模型知识编辑方法 217
8.3.1 基于外部干预的知识编辑方法 218
8.3.2 基于内部更新的知识编辑方法 222
8.4 模型编辑影响分析 225
8.4.1 知识能力影响 225
8.4.2 通用能力影响 227
8.5 应用与实践 227
8.5.1 EasyEdit开源知识编辑工具实践 227
8.5.2 OneEdit知识编辑框架 230
8.5.3 大模型知识编辑应用 230
8.6 本章小结 232
第9章 知识增强多模态学习 233
9.1 知识增强多模态概述 234
9.1.1 人类认知系统 234
9.1.2 融合两种记忆 234
9.1.3 知识图谱与多模态学习 235
9.2 多模态与大模型 236
9.2.1 多模态任务简介 236
9.2.2 多模态生成模型 238
9.2.3 多模态大模型 241
9.3 知识增强视觉问答 242
9.3.1 视觉问答与知识图谱 243
9.3.2 知识增强视觉问答的基本过程 244
9.3.3 典型案例:知识增强多模态视觉问答 249
9.4 知识增强跨模态检索 251
9.4.1 跨模态检索与知识图谱 251
9.4.2 典型案例:知识增强多模态语义检索 252
9.5 知识增强低资源多模态学习 254
9.5.1 低资源学习与知识图谱 254
9.5.2 典型案例:知识增强的零样本学习 255
9.6 知识增强多模态生成 257
9.6.1 多模态生成任务概述 257
9.6.2 典型案例:知识增强视觉叙事 258
9.7 知识增强多模态幻觉检测 260
9.7.1 领域知识与大模型幻觉检测 260
9.7.2 典型案例:知识引导的多模态幻觉检测 262
9.8 本章小结 264
第10章 知识智能体与世界模型 266
10.1 概述 267
10.2 AI智能体与工具调用 268
10.2.1 什么是AI智能体 268
10.2.2 AI智能体架构 270
10.2.3 AI智能体学习 275
10.2.4 为什么需要知识增强AI智能体 276
10.3 知识增强的AI智能体 277
10.3.1 知识增强的单智能体规划 277
10.3.2 知识增强的多智能体协同 281
10.4 总结与展望 282
10.4.1 大模型的知识机制 282
10.4.2 具身智能与世界模型 283
10.4.3 世界知识模型 284
参考文献 286