本书系统化探讨大模型在企业场景中的技术与应用,全面覆盖大模型兴起的技术背景、发展趋势,以及提示词工程、智能体、模型微调、推理等关键应用技术。书中重点介绍了LangChain等开发框架,并深度剖析医疗、教育、智能驾驶、科研等行业应用案例,展现大模型赋能产业升级的巨大潜力。本书遵从理论到实践的路径,致力于为企业构建可扩展、高性能的大模型应用体系提供完整方法论和技术解决方案,适合作为企业智能化升级的参考读物。
惠润海,教授级高工,长期致力于面向人工智能和高性能计算的先进算力与数据存储的研究和规划,拥有20多年的专业经验,承担过多项国家和省级重大项目课题,获得过多项省部级以上奖项。王延飞,大模型应用与算力调度专家,技术公众号“萤火AI百宝箱”创办人,专注于算力、云原生、大模型等方向的深度分享,在技术社区创下超千万阅读记录。
第1章 人工智能的起源与演进 1
1.1 日常生活中的人工智能 1
1.2 从图灵测试到专家系统 2
1.3 神经网络的初步探索 4
1.4 本章小结 5
第2章 机器学习的崛起 6
2.1 机器学习的定义与核心思想 6
2.2 机器学习方法 7
2.2.1 有监督学习 7
2.2.2 无监督学习 10
2.2.3 强化学习 12
2.3 机器学习的常用算法 15
2.3.1 有监督学习的常用算法 15
2.3.2 无监督学习的常用算法 17
2.3.3 强化学习的常用算法 19
2.3.4 如何选择最佳机器学习算法 21
2.4 机器学习在IBM Watson中的应用 25
2.5 本章小结 26
第3章 深度学习的革命 27
3.1 深度学习的发展历程 27
3.2 深度神经网络基础 34
3.2.1 神经元 34
3.2.2 单层神经网络 35
3.2.3 多层神经网络 35
3.3 关键技术突破:RNN、CNN、GAN 38
3.3.1 RNN:循环神经网络 38
3.3.2 CNN:卷积神经网络 40
3.3.3 GAN:生成对抗网络 42
3.3.4 RNN、CNN和GAN的优缺点对比 43
3.4 ImageNet挑战赛 43
3.5 经典AI与现代AI的分野 45
3.5.1 IBM深蓝:经典AI的巅峰 45
3.5.2 AlphaGo:现代AI的典范 46
3.6 本章小结 47
第4章 大模型的兴起与发展 48
4.1 大模型的崛起 48
4.2 大模型的分类 51
4.3 大模型的特点 52
4.3.1 参数规模大 52
4.3.2 算力消耗大 54
4.3.3 数据Token化 55
4.3.4 泛化能力 58
4.4 Transformer 60
4.4.1 Transformer的特点 60
4.4.2 Transformer的架构设计 63
4.4.3 Transformer的发展历程 70
4.4.4 Transformer的应用场景 71
4.5 GPT系列模型 73
4.6 DeepSeek系列模型 78
4.6.1 DeepSeek的发展历程 78
4.6.2 DeepSeek的技术创新 79
4.7 大模型发展趋势:技术与应用的双向推进 84
4.8 本章小结 86
第5章 提示词工程:大模型的沟通话术 88
5.1 提示词的重要性 89
5.2 大模型提示词的工作流程 90
5.2.1 提示词工程的工作机制 90
5.2.2 提示词工程的工作流程 92
5.3 大模型提示词编写技术及最佳实践 93
5.3.1 角色设定与指令注入 93
5.3.2 问题拆解与分层设计 94
5.3.3 编程思维与Few-Shot设计 95
5.3.4 高级提示词设计技巧 96
5.4 巧用万能Prompt 97
5.5 使用CO-STAR框架编写提示词 99
5.5.1 CO-STAR框架的使用方法 100
5.5.2 CO-STAR框架的代码案例 101
5.6 推理大模型的提示词设计 103
5.7 本章小结 107
第6章 智能体应用 108
6.1 智能体:大模型落地的“最后一公里” 108
6.2 ReAct Agent实现智能体与环境交互 113
6.2.1 ReAct Agent的特点 113
6.2.2 ReAct Agent的架构组成 114
6.2.3 ReAct Agent的工作流程 115
6.3 智能体生态:构建智能体发展的基础 116
6.4 智能体与具身智能 118
6.5 斯坦福小镇模拟人类行为 120
6.5.1 技术架构与实现 122
6.5.2 智能体设计与行为生成 123
6.6 本章小结 125
第7章 模型微调与定制化 126
7.1 为什么需要微调 126
7.2 大模型微调技术路线 128
7.3 大模型的高效微调 132
7.3.1 Hugging Face的三大创新 132
7.3.2 LoRA:参数高效微调的技术突破 133
7.3.3 实战:高效微调Llama模型 135
7.4 检索增强生成和微调 140
7.4.1 企业级RAG系统设计 143
7.4.2 企业级微调系统设计 147
7.5 本章小结 151
第8章 大模型推理与服务化 152
8.1 什么是大模型推理 152
8.2 大模型推理引擎 154
8.2.1 TensorRT-LLM 155
8.2.2 vLLM 157
8.2.3 LMDeploy 162
8.2.4 Hugging Face TGI 165
8.3 大模型的推理优化 168
8.3.1 大模型推理的优化手段 170
8.3.2 提升大模型数学推理能力 171
8.4 大模型推理评估 177
8.5 KServe:基于Kubernetes的标准化模型推理平台 180
8.5.1 KServe架构解析 181
8.5.2 KServe的关键技术优势 184
8.5.3 Kserve推理服务的发布流程 186
8.5.4 实战:KServe快速发布推理服务 188
8.6 本章小结 195
第9章 大模型应用开发框架LangChain 196
9.1 为什么需要LangChain 196
9.2 LangChain的架构设计 198
9.3 LangChain的关键概念 201
9.4 实战:LangChain API 207
9.5 LangGraph Agent:赋予大模型执行力的智能体框架 218
9.6 实战:基于LangChain构建智能知识库问答系统 224
9.7 本章小结 239
第10章 医疗健康:大模型助力健康革命 240
10.1 医疗健康行业概览 241
10.1.1 医疗健康行业面临的主要挑战 242
10.1.2 医疗健康数据的特点与价值 243
10.1.3 医疗健康行业的智能化转型 245
10.2 AI重塑医疗服务价值链 247
10.2.1 AI医疗的关键能力 247
10.2.2 AI医疗自动化的不同阶段 249
10.2.3 AI赋能诊前、诊中、诊后环节 250
10.3 大模型在医疗健康行业的核心应用场景 252
10.3.1 辅助诊断:提升诊断效率与准确性 252
10.3.2 药物研发:加速新药发现与优化 255
10.3.3 健康管理与公共卫生:构建智能健康防线 256
10.4 大模型技术在医疗健康行业的创新实践 257
10.4.1 Google医疗AI模型Med-Gemini 257
10.4.2 清华大学智能体医院 261
10.5 本章小结 267
第11章 教育革新:大模型重塑学习体验 269
11.1 教育技术的发展:机遇与挑战 270
11.1.1 传统教育技术的局限 270
11.1.2 大模型带来的机遇 271
11.1.3 教育技术发展面临的挑战 272
11.2 大模型赋能教育:个性化学习与教学辅助 274
11.2.1 大模型在个性化学习中的应用:千人千面,因材施教 276
11.2.2 大模型在教学辅助中的应用:解放教师,提质增效 279
11.3 教育领域的大模型技术创新案例 281
11.3.1 EduChat的核心功能 281
11.3.2 EduChat的构建过程 283
11.3.3 EduChat效果验证 286
11.4 大模型在教育中的应用前景 287
11.5 本章小结 288
第12章 智能驾驶:大模型推动未来出行 290
12.1 智能驾驶:一个空间机器人的时代 291
12.2 智能驾驶与大模型 292
12.2.1 智能驾驶中的大模型技术 292
12.2.2 大模型成为智能驾驶技术突破的核心力量 297
12.3 智能驾驶案例:特斯拉FSD系统 298
12.3.1 特斯拉FSD系统的技术基石:端到端神经网络架构 298
12.3.2 视觉感知核心:BEV+Transformer 299
12.3.3 深度学习与强化学习在特斯拉FSD系统中的深度应用 300
12.3.4 大模型驱动的技术飞跃:特斯拉FSD系统的进化之路 301
12.3.5 FSD技术面临的挑战与未来发展 304
12.4 本章小结 305
第13章 科研探索:大模型加速科学发现 306
13.1 科研领域的创新需求与挑战 307
13.1.1 数据洪流:机遇与挑战并存 307
13.1.2 跨学科研究的瓶颈 308
13.1.3 科研效率亟待提升 310
13.2 大模型技术在科研数据分析与模拟中的应用 310
13.2.1 天文学:大模型助力天文图像分析 311
13.2.2 化学:大模型赋能下的分子与材料探索 312
13.2.3 生物学:大模型加速生命科学的理解与设计 316
13.2.4 数学:大模型推动算法的自我进化 317
13.2.5 地球科学:大模型洞悉地球系统的奥秘 319
13.2.6 神经科学:大模型揭示大脑的秘密 321
13.3 AI For Science的代表:AlphaFold 322
13.3.1 AlphaFold的技术突破 323
13.3.2 AlphaFold 2的工作流程 323
13.3.3 AlphaFold 2的应用领域 326
13.3.4 AlphaFold 3:进一步的突破与挑战 326
13.4 本章小结 327
结语 329