这就是DeepSeek:DeepSeek从原理到实践
定 价:69 元
- 作者:王卓,薛栋,隆建 著
- 出版时间:2025/10/1
- ISBN:9787301361696
- 出 版 社:北京大学出版社
- 中图法分类:TP18
- 页码:236
- 纸张:
- 版次:1
- 开本:16开
-
商品库位:
这是一本系统讲解DeepSeek大模型的技术指南,它全面覆盖DeepSeek的底层架构、核心原理及实际应用。本书从人工智能基础、DeepSeek的技术架构,到多模态模型的训练与优化,帮助读者深入理解DeepSeek的工作机制,并掌握DeepSeek在大规模预训练、推理优化及应用部署中的关键技术。全书共有12章,主要包括DeepSeek的使命与愿景、人工智能与大模型、DeepSeek底层架构解密、DeepSeek的工作原理、DeepSeek的内部机制、DeepSeek的架构揭秘、DeepSeek的训练过程、DeepSeek的训练优化与成本控制、DeepSeek-R1、稀疏矩阵技术、DeepSeek部署实战,以及DeepSeek接入实战。
本书全面而深入的技术解读,不仅适用于对大模型感兴趣的技术人员,还适合人工智能研究者、开发者及行业从业者。同时,书中结合实战案例和对比分析,帮助读者理解DeepSeek的独特优势及未来的发展方向。
王卓
华中科技大学计算机硕士,精通C、C++、C#、Python等语言。曾任阿里达摩院资深算法工程师,参与Qwen1/Qwen1.5大模型落地工作,擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。
薛栋
华东理工大学信息科学与技术学院副教授/硕士生导师,德国慕尼黑工业大学博士,荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学(RUG)、德国卡尔斯鲁厄理工学院(KIT)任教,长期从事人工智能与大数据研究,发表SCI论文30余篇,主持多项国家及企业科研项目。所在X-D Lab已推出MindChat、Sunsimiao、GradChat等垂直领域大模型项目。
隆建
华东理工大学副教授/博导,主要研究人工智能方法及工业应用,发表论文60余篇,拥有50余项专利。主持20余项国家及企业科研项目,荣获多项国家/省部级科技奖项,并指导学生获得20余项奖项。
第1章 DeepSeek的使命与愿景:开辟AI应用新纪元
1.1 DeepSeek的由来
1.2 DeepSeek的主要产品和应用场景
1.3 DeepSeek与其他模型的性能对比
1.4 DeepSeek初体验
1.5 DeepSeek API
第2章 人工智能与大模型:智能时代的核心引擎
2.1 人工智能基础介绍
2.2 什么是大模型
2.3 神经网络
2.4 网络模型
第3章 DeepSeek 底层架构解密:探寻大模型的基石
3.1 基于 Transformer架构
3.2 动态任务分配:智能计算的自适应引擎
3.3 稀疏激活机制:动态结构感知的高效优化范式
3.4 MoE架构:基于稀疏专家的动态路由系统
3.5 归一化技术:稳定性与效率的平衡术
3.6 多令牌预测技术:增强推理能力的新途径
3.7 高效并行策略:性能极限的系统设计
3.8 混合精度与量化:训练效率的加速器
3.9 显存优化与结构共享:资源利用的范式创新
第4章 DeepSeek 的工作原理:从生成到模型安全的全面解析
4.1 逐词生成:DeepSeek的输出过程
4.2 概率模型:如何生成有意义的文本
4.3 性能优化与效率提升
4.4 模型的安全性与可靠性
第5章 DeepSeek 的内部机制:智能思维的发动机
5.1 “嵌入”与向量空间
5.2 语义理解与生成
5.3 模型的决策过程
第6章 DeepSeek 的架构揭秘:驾驭大模型的核心
6.1 探索模型网络:基础DeepSeekMoE架构剖析
6.2 升级进化:DeepSeek-V3模型全景
6.3 多模态大模型:DeepSeek的跨感知融合
6.4 升级版Janus-Pro:多模态进阶的实践与优化
第7章 DeepSeek 的训练过程:从数据到微调的全流程揭秘
7.1 数据准备与预处理
7.2 基础训练:从无到有
7.3 微调与优化:提升性能
第8章 DeepSeek 的训练优化与成本控制:效率与经济性的双重探索
8.1 数据规模、训练策略与低成本秘诀
8.2 链式思考与可解释推理:DeepSeek的独到之处
8.3 开源策略:如何用开放共享降低壁垒
第9章 DeepSeek-R1:推理模型的革新之旅
9.1 DeepSeek-R1全景探秘
9.2 DeepSeek-R1开源信息概览
9.3 DeepSeek-R1-Zero自进化训练体系揭秘
9.4 全场景强化学习:分析完整的训练策略
9.5 蒸馏处理
第10章 稀疏矩阵技术:计算效率的新型加速利器
10.1 稀疏矩阵技术概述
10.2 稀疏矩阵技术在DeepSeek中的应用
10.3 稀疏矩阵技术的前沿探索
第11章 DeepSeek 部署实战:从本地到云端的一体化落地
11.1 基于Ollama的本地部署
11.2 基于Chatbox的本地部署
11.3 基于LM Studio的本地部署
11.4 基于Ollama+Docker+Open WebUI的本地部署
11.5 DeepSeek的远程和云端部署
第12章 DeepSeek 接入实战:无缝集成与多平台落地指南
12.1 Chatbox接入实战
12.2 NextChat接入实战
12.3 通过OfficeAI将DeepSeek接入Office
12.4 将DeepSeek接入VS Code
12.5 将DeepSeek接入PyCharm
12.6 基于茴香豆+DeepSeek的微信聊天机器人