玩透DeepSeek:认知解构+技术解析+实践落地
定 价:79 元
- 作者:段玉聪,朱绵茂,梅映天,庞兴梅 著
- 出版时间:2025/7/1
- ISBN:9787301363935
- 出 版 社:北京大学出版社
- 中图法分类:TP18
- 页码:256
- 纸张:
- 版次:1
- 开本:16开
-
商品库位:
本书是系统讲解DeepSeek大模型的技术指南,结合数据、信息、知识、智慧、意图白盒测评这一前沿理念,详
细阐述如何在大模型时代实现模型选取、定制优化与多模型协同,从而打造出最适合实际应用需求的智能系统。
本书共12章,分别从大模型时代的来临、DeepSeek的核心技术与创新突破、DIKWP白盒测评理念详解、模型
择优、大模型优化方法与实践指南、DeepSeek实战优化策略、大模型的协同与互补、DeepSeek与国内外主要大模型
及其AI智能体的对比分析、行业应用案例分析等方面进行阐述,帮助读者深入理解DeepSeek的工作机制,并掌握其
在大规模预训练、推理优化及应用部署中的关键技术。
本书旨在为广大人工智能爱好者、技术开发者和企业决策者提供一部既具理论深度又通俗易懂的指导手册,也
适合作为大、中专院校人工智能相关专业的教学参考书。
段玉聪【著】【中国】【现当代】
————————————————————
段玉聪,海南大学计算机学院教授,国际先进技术与工程院院士、美国国家人工智能科学院通讯院士、世界人工意识协会理事长、中美硅谷发展促进会名誉会长、中欧科学家论坛共同主席、中国科协海智特聘专家、中国科技产业促进会科技战略专家咨询委员会副主任、中国工程院咨询研究专家、世界人工意识大会主席、人工智能DIKWP国际测评标准委员会主任。连续4年入选斯坦福顶尖科学家终身榜和年度榜,发表论文300余篇,已授权中国及国际发明专利110余项。
朱绵茂【著】【中国】【现当代】
————————————————————
朱绵茂 ,海南开放大学宣传统战部长、教授、博导,是国际金融法、人工智能法、自由贸易港法和国家安全学方向的博导,系我国首批国家安全学博导。海南自由贸易港领军人才。北京大学法学博士、中国社会科学院法学博士后。系中国法学会国际经济法学研究会副会长、教育部全国高职高专法律类专业教学指导委员会委员、中国国防部首批国家国防教育师资库入库专家、海南省政府法律顾问、北京交通大学国家安全法治发展研究院副院长、海南金融发展促进会副会长、海南省人工智能研究会常务理事。“海南省十大杰出青年”, “海南省首届优秀中青年法学家”,“海南省委省政府直接联系重点专家”。主持完成国家社会科学基金一项,参与海南马工程重大项目一项;系海南省人大委托起草《中华人民共和国海南自由贸易港法》(学者版)起草小组负责人之一;参与海南省《海南省“十四五”经济发展规划》课题学者版的起草工作。主编《合同法卷》获社会科学优秀成果奖编著三等奖,“双核驱动、六线融合的法律文秘专业人才培养模式创新与实践”获海南省高等教育省级教学成果一等奖,主持“国际经济贸易法人才团队”被海南省委认定为首批海南省“双百”人才团队 。有专著2本,合著16本,参与本科教材《国际金融法》编写,在《中国人民大学学报》等核心刊物上发表学术论文70多篇。
梅映天【著】【中国】【现当代】
————————————————————
梅映天
庞兴梅【著】【中国】【现当代】
————————————————————
庞兴梅
引言:
大模型时代的来临
1.1 智能涌现的契机 002
1.1.1 初创与技术探索 002
1.1.2 用户热情与需求激增 004
1.1.3 社会变革与产业升级 005
1.1.4 国际竞争与技术自主 006
1.2 DeepSeek 横空出世 006
1.2.1 起源与发展历程 006
1.2.2 低成本高性能的技术秘密 007
1.2.3 国际影响与市场震荡 007
1.2.4 案例解读与未来展望 008
1.3 为什么需要新理念 008
1.3.1 黑盒测评的局限 009
1.3.2 白盒测评的提出与意义 009
1.3.3 白盒测评的实践意义 009
1.3.4 白盒测评在行业应用中的潜力 010
1.4 总结 010
DeepSeek解析:
核心技术与创新突破
2.1 DeepSeek 的发展路径 012
2.1.1 初创与技术探索 012
2.1.2 里程碑事件:发布DeepSeek-V3 版本 013
2.1.3 专用模型的推出:DeepSeek-R1 015
2.2 模型架构与规模 016
2.2.1 混合专家(MoE)架构解析 016
2.2.2 参数规模与计算效率 017
2.2.3 内部机制剖析 018
2.3 突破性能瓶颈 020
2.3.1 低成本硬件的高效利用 020
2.3.2 英伟达H800 GPU的运用与成本 控制 020
2.3.3 模型蒸馏技术的应用 021
2.4 性能对比与评价 022
2.4.1 权威测评指标 022
2.4.2 DeepSeek与国内外顶尖模型的 对比 023
2.5.1 开源策略的优势 026
2.5.2 插件生态与交流合作 027
2.5.3 开源对企业应用的推动作用 027
2.6 总结 028
DIKWP 白盒测评理念详解
3.1 黑盒测评与白盒测评:从结果到过程的 转变 030
3.1.1 传统黑盒测评的定义与局限 030
3.2.1 数据层(Data):感知与原始信息的 获取 032
3.2.2 信息层(Information):信息提取与 初步处理 034
3.2.3 知识层(Knowledge):信息组织与 系统构建 035
3.2.4 智慧层(Wisdom):高层次推理与 问题解决 037
3.2.5 意图层(Purpose):目标识别与 行为调控 038
3.3 DIKWP 测评体系的设计与实施 040
3.3.1 测评设计理念与目标 040
3.3.2 四大模块详细设计 041
3.3.3 测评流程与标准 051
3.4 测评结果分析:各大模型在 DIKWP 体系下 的表现 052
3.4.1 感知与信息处理模块测试 052
3.4.2 知识体系构建与推理模块测评 054
3.4.3 智慧应用与问题解决模块测评 055
3.4.4 意图识别与行为调整模块测评 057
3.4.5 测评结论与行业启示 058
3.5 意义与未来展望:从“会想”到“会行动” 的新纪元 059
3.5.1 为研究者与开发者带来的全新 视角 059
3.5.2 引领人工智能迈向“自觉”时代 059
3.5.3 多模型协同与定制化优化的新 方向 059
3.5.4 未来展望:从“会想”到 “会行动”060
3.6 总结 060
模型择优:
如何选择合适的大模型
4.1 明确任务需求 062
4.1.1 任务场景及核心需求 062
4.1.2 结合DIKWP框架分析需求侧 重点 064
4.2 对比模型强项与弱项 065
4.2.1 市场主流模型对比概述 065
4.2.2 最新测评数据支撑 065
4.3 模型选择策略 066
4.3.1 分步选型流程 067
4.3.2 选型策略示例 069
4.3.3 多模型共存与组合策略 071
4.3.4 成本、安全与数据隐私考量 073
4.4 开源 vs 封闭:选型中的多维度比较 074
4.4.1 开源模型的详细优劣分析 074
4.4.2 封闭模型的详细优劣分析 075
4.4.3 给企业决策者的选型建议 076
4.5 成本、安全与长期优化的综合考量 076
4.5.1 成本评估 076
4.5.2 数据安全与隐私保护 077
4.5.3 技术生态与未来优化 078
4.6 综合决策与实践建议 078
4.6.1 决策流程解析 078
4.6.2 实践建议 078
4.7 未来趋势与展望 079
4.7.1 模型轻量化与垂直化 080
4.7.2 多模型协同与智能调度 080
4.7.3 数据安全与隐私保护的不断升级 080
4.7.4 成本与资源利用的最优化 080
4.7.5 开源与闭源并存的新生态 081
4.8 总结 081
大模型定制:
优化方法与实践指南
5.1 为何要定制 084
5.1.1 行业与企业需求的多样性 084
5.1.2 定制化的意义与价值 085
5.2 微调 085
5.2.1 微调的基本概念 085
5.2.2 微调的整体流程 086
5.2.3 微调的最佳实践 088
5.2.4 微调过程中的常见问题及解决 方案 089
5.3 提示工程 090
5.3.1 提示工程的基本原理 090
5.3.2 提示工程的策略与技巧 090
玩透 DeepSeek
认知解构 + 技术解析 + 实践落地
5.3.3 提示工程的实际案例 092
5.3.4 提示工程在意图对齐中的应用 093
5.4 人类反馈与对齐 094
5.4.1 人类反馈强化学习的基本原理与 流程 094
5.4.2 ChatGPT中的RLHF成功经验 095
5.4.3 如何在DeepSeek等模型中引入 RLHF 096
5.4.4 RLHF面临的挑战 097
5.5 知识增强与工具使用 098
5.5.1 检索增强的概念 098
5.5.2 构建与集成知识库 099
5.5.3 工具调用与插件机制 100
5.5.4 实际案例:企业定制问答系统 101
5.6 多模态扩展 101
5.6.1 多模态技术的重要性 102
5.6.2 多模态扩展的实现方法 103
5.6.3 多模态扩展的案例分析 104
5.6.4 多模态技术的未来 104
5.7 效果测评与迭代 105
5.7.1 定制优化是一个反复迭代的过程 105
5.7.2 测评方法与指标设计 106
5.7.3 自动化测评与反馈机制 108
5.7.4 实际案例:金融智能投顾系统的迭代 优化 109
5.7.5 形成迭代改进闭环的重要性 110
5.8 DeepSeek 入门实战 112
5.8.1 DeepSeek在线版 112
5.8.2 DeepSeek本地部署教程 114
5.9 总结 119
深入浅出:
DeepSeek实战优化策略 6.1 模型能力剖析 122
6.2 定制需求场景构建研究——以“数字家庭医生” 为例 122
6.2.1 场景背景与行业需求 122
6.2.2 具体需求分析 123
6.3 数据准备与微调实践 124
6.3.1 数据准备 124
6.3.2 微调过程实施 125
6.3.3 微调效果预期 126
6.4 提示与规则设计 126
6.4.1 系统提示设计的重要意义 126
6.4.2 系统提示的设计原则 126
6.4.3 少量示例引导方法研究 127
6.4.4 动态规则机制 127
6.5 性能测试与调优 128
6.5.1 模拟测试环境构建 128
6.5.2 测试指标设定 128
6.5.3 测试结果反馈与问题诊断 129
6.6 总结经验与闭环构建 129
6.6.1 数据量与质量的决定性影响 129
6.6.2 领域专家参与的必要性分析 130
6.6.3 微调与提示工程的协同优化 130
6.6.4 RLHF与外部工具的集成应用 130
6.6.5 多模态扩展与协同应用 130
6.6.6 迭代优化闭环构建 131
6.7 总结 131
模型组合:
大模型的协同与互补
7.1 单一模型的局限性 134
7.1.1 单一模型于不同任务间表现差异 显著 134
7.1.2 单一模型的缺陷凸显组合策略的 必要性 135
7.2 多模型组合模式 135
7.2.1 流水线式组合模式 135
7.2.2 专家分工式组合模式 136
7.2.3 投票集成式组合模式 137
7.2.4 概率集成与模型嫁接 138
7.2.5 混合专家模型 139
7.3 模型协调与控制 140
7.3.1 协调框架的构建 140
7.3.2 上下文共享与信息融合 140
7.3.3 动态路由与调度 140
7.3.4 实时监控与反馈控制 141
7.4 应用案例:智能手术机器人系统 141
7.4.1 案例背景 141
7.4.2 系统工作流程 142
7.5 应用案例:AI 智能体时代协议 143
7.5.1 知乎芝士平台协议分析 144
7.5.2 个性化协议设计思路与原则 144
7.5.3 协议实施的技术框架与实现路径 145
7.6 协同的挑战 146
7.6.1 模型输出冲突 146
7.6.2 延迟与计算成本 147
7.6.3 系统复杂度与维护 148
7.7 展望群智 AI 149
7.7.1 多样性融合 149
7.7.2 自主决策与智能调度 150
7.7.3 经济高效的应用场景 150
7.7.4 新型应用场景 150
7.7.5 未来研究方向 150
7.8 总结 151
DeepSeek与国内外主要大模型及 其 AI 智能体的对比分析
8.1 DeepSeek 和 Manus 之间的比较 分析 154
8.1.1 技术架构 154
8.1.2 功能定位 156
8.1.3 应用场景 157
8.1.4 结论 157
8.2 DeepSeek 与 ChatGPT-4 的比较 分析 158
8.3 总结 161行业应用案例分析
9.1 行业应用案例 164
9.1.5 其他应用案例 175
9.2 综合评估和案例对比 177
9.2.1 数据层评估 177
9.2.2 信息层评估 179
9.2.3 知识层评估 181
9.2.4 智慧层评估 184
9.2.5 意图层评估 187
9.2.6 行业案例对比总结 190
9.3 行业应用策略分析与展望 192
9.3.1 案例综合分析 192
9.3.2 行业应用的前景展望 194
9.3.3 挑战与改进 196
9.3.4 未来发展方向 198
9.4 总结 200
企业与机构定制和采购 LLM的白盒 测评指南
10.1 白盒测评方法论 203
10.1.1 框架概述 203
10.1.2 测评流程 205
10.2 机构采购 LLM 的关键考量 208
10.2.1 数据安全 208
10.2.2 成本控制 209
10.2.3 可扩展性 210
10.3 白盒测评在采购过程中的案例展示 211
10.4 白盒测评在采购过程中的流程详解 212
10.4.1 模型选型案例 212
10.4.2 合同验收案例 213
10.5 构建反馈认知通道 214
10.6 总结 216最佳实践与常见误区
11.1 大模型应用的十大最佳实践 220
11.1.1 明确目标 220
11.1.2 选对模型 221
11.1.3 循序优化 222
11.1.4 评估驱动 223
11.1.5 数据为王 224
11.1.6 融合专业知识 225
11.1.7 注重用户反馈 226
11.1.8 保证安全与伦理 227
11.1.9 成本效益平衡 228
11.1.10 拥抱开源生态 229
11.2 常见误区警示 229
11.2.1 盲目迷信参数规模 230
11.2.2 忽略上下文长度约束 230
11.2.3 缺乏充分测评就上线 231
11.2.4 过度拟合 232
11.2.5 忽视用户反馈 232
11.2.6 安全与伦理风险 233
11.3 策略复盘 234
11.3.1 AI家庭医生在医疗健康领域的 应用 234
11.3.2 复盘和启示 238
11.4 总结 239
结语:
未来展望与读者行动指南