深度剖析DeepSeek大模型_丁小晶，崔远编著_9787111779223

深度剖析DeepSeek大模型

定　　价：99.9 元

作者：丁小晶，崔远编著
出版时间：2025/3/1
ISBN：9787111779223
出版社：机械工业出版社

中图法分类：TP18
页码：330页
纸张：
版次：1
开本：24cm
商品库位：

内容简介

全书共分为12章，首先介绍大模型的基础知识与发展历程，从神经网络的起源到大规模预训练模型的演化，再到Transformer、BERT与GPT等模型架构的深入剖析，帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术，包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践，介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术，并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用，如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。

你还可能感兴趣

我要评论