关于我们
新书资讯
新书推荐

图解DeepSeek技术

 图解DeepSeek技术

定  价:59.8 元

  • 作者:[沙特] 杰伊·阿拉马尔(Jay Alammar) [荷] 马尔滕·格鲁滕多斯特
  • 出版时间:2025/6/1
  • ISBN:9787115674616
  • 出 版 社:人民邮电出版社
  • 中图法分类:TP18-64 
  • 页码:
  • 纸张:胶版纸
  • 版次:
  • 开本:16开
  • 商品库位:
9
7
6
8
7
7
4
1
6
1
1
5
6

读者对象:本书适用于大模型从业人员和对大模型底层技术感兴趣的读者

本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。



全书分为3章和附录,第1章详细分析了推理大模型的范式转变,即从训练时计算到测试时计算;第2章解读了DeepSeek-R1的架构混合专家(MoE);第3章展示了DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO的强化学习等;附录分享了DeepSeek开源周活动。



本书适合大模型从业人员和对大模型底层技术感兴趣的读者。书中通过丰富的图解将复杂的技术解释得简单、清晰、通透,是学习大模型技术难得一见的参考书。

 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容