关于我们
新书资讯
新书推荐

深度剖析DeepSeek大模型

深度剖析DeepSeek大模型

定  价:99.9 元

  • 作者:丁小晶,崔远编著
  • 出版时间:2025/3/1
  • ISBN:9787111779223
  • 出 版 社:机械工业出版社
  • 中图法分类:TP18 
  • 页码:330页
  • 纸张:
  • 版次:1
  • 开本:24cm
  • 商品库位:
9
7
7
8
7
7
9
1
2
1
2
1
3
全书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的深入剖析,帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容