中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈

  DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。本篇报告我们通过分析DeepSeek V3和R1模型论文,理解其核心逻辑是“按需分配算力,最小化冗余计算”,使得千亿级模型在低成本硬件(甚至边缘设备)上高效运行成为可能,为大规模商业化落地提供了技术基础。我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:建议核心关注晶圆代工、国产算力芯片、定制化存储、终端品牌、SoC五大方向。

  ▍DeepSeek如何实现的训练成本降低?

  1)架构创新: DeepSeek-V3的基础架构中采用了DeepSeekMoE专家架构和MLA多头潜在注意力机制,DeepSeekMoE通过细粒度专家分配、共享专家及无辅助损失负载均衡策略优化传统MoE,提升计算资源效率;MLA通过低秩联合压缩减少注意力键值缓存占用,提升计算效率、减少内存消耗。

  2)FP8混合精度训练:在全球主流大模型中率先采用FP8低精度数据进行大规模训练,大部分核心计算用FP8提升速度、降低内存用量,部分关键操作保留高精度确保动态稳定性。

  3)训练工程优化:DeepSeek在主流大模型中率先采用硬盘充当输入端缓存,设计DualPipe算法实现高效流水线并行,融合前后向通信阶段,减少阻塞;采用定制化高效跨节点all-to-all通信内核降低通信开销;通过重计算、EMA、共享向量和输出头减少内存占用。

  4)数据策略优化:应用多token预测机制MTP,增加训练信号密度,减少20%训练迭代次数,帮助模型捕捉长距离依赖关系。

  ▍DeepSeek如何实现的推理成本降低?

  DeepSeek-V3对推理的预填充和解码两个阶段都优化了专家使用效率:预填充阶段MoE用EP32及冗余专家策略提升效率,解码阶段探索动态路由减少通信开销;还通过支持FP8、INT8量化和提供蒸馏版本,实现低精度量化与模型压缩,减少显存占用。DeepSeek的开源生态可以更好支持硬件厂商适配,例如可以对MLA算子优化提升推理效率,DeepSeek-R1发布后国内外芯片厂商快速响应支持DeepSeek。1月25日,AMD宣布已将新的DeepSeek-V3集成到Instinct MI300X GPU上并经过SGLang对推理过程进行了优化,英伟达、英特尔也随后在1月31日官宣支持。国内厂商都已经官宣完成对DeepSeek的适配,国产算力成为相对稳定可靠的选项,支撑国产大模型从研发走向商业化。

  ▍从DeepSeek算力需求看AI芯片设计方向?

  DeepSeek 在论文的芯片设计意见指导中指出通信和计算同等重要,计算方面降低精度和内存需求是关键。在通信硬件优化上,DeepSeek建议开发独立通信协处理器,实现计算与通信物理分离,同时建议融合网络架构,统一IB和 NVLink的网络协议栈,统一通信接口以简化编程复杂度和降低通信延迟;在计算硬件优化上,建议提升 FP8 计算精度,并支持分块量化与在线量化,减少访存开销,提升推理效率。我们认为DeepSeek建议带来两点启示:

  1)“推理速度”基本90%是由decoding阶段决定的,因此内存容量决定大模型推理速度,我们认为内存升级仍是算力芯片升级的重点方向,看好近存计算发展。

  2)我们认为在模型开源的策略下,DeepSeek-R1蒸馏后的小模型性能有望持续快速提升,帮助端侧硬件加速接入,助力AI应用全面落地。我们看好品牌商和SoC芯片厂商的成长机遇。

  ▍风险因素:

  算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期;相关产业政策出台力度不及预期;AI技术及应用发展不及预期;芯片技术迭代不及预期;国产先进制程量产进展不及预期;行业竞争加剧等。

  ▍投资策略:

  我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:

  1)云端:DeepSeek有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长。

  2)终端:我们看好DeepSeek带来模型轻量化的全面升级,端侧硬件接入有望加速爆发,助力AI应用全面落地,建议关注品牌厂商,SoC芯片厂商。

本文来自作者[adminc]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/post/7035.html

(27)

文章推荐

  • iPhone15 有哪些新特性?相比前代有何不同

    iPhone15有哪些新特性?相比前代有何不同iPhone15有哪些新特性iPhone15可能会带来一些新的特性和改进。首先,在外观设计上可能会有一些细微的变化,比如边缘可能会更加圆润。处理器方面,预计会采用更强大的芯片,提升性能和效率。摄像头系统可能会得到进一步优化,拍照和录

    2025年01月16日
    57
  • 玩牛牛怎么赢

    在众多的纸牌游戏中,牛牛以其独特的规则和趣味性吸引了不少玩家。然而,许多玩家都怀揣着一个共同的疑问:玩牛牛怎么赢的几率大?首先,我们得了解一下牛牛这个游戏的背景。牛牛起源于民间,它是一种纸牌游戏,通常使用一副除去大小王的52张扑克牌。游戏一般由2-6人参与,在一些热闹的聚会场所或者棋牌室,经常能

    2025年02月13日
    37
  • 挖掘业绩新增长极 券商持续发力国际业务

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  挖掘业绩新增长极  券商持续发力国际业务  ◎记者唐燕飞  国际业务正在成为券商业绩的重要增长极,跨境财富管理、投资银行、资产管理等业务“多点开花”。  “跨境理财通2.0”券商渠道开闸以来,多家券商开户数

    2025年02月15日
    37
  • 光大期货:2月17日能源化工日报

      原油:地缘可能走向缓和,市场波动将进一步放大  1、周度油价重心下移,截至周五WTI3月合约收盘至70.74美元/桶,周度跌幅0.69%。布伦特4月合约收盘至74.74美元/桶,周度跌幅0.07%。SC2503以608.2元/桶收盘。受到俄乌冲突有可能缓和的影响,地缘溢价开始回落。

    2025年02月17日
    37
  • 欧洲债市:德国国债收窄跌幅 交易员为供应可能增加做准备

      德国国债缩小熊市趋陡走势,跑输欧元区其他国债和英国国债。交易员们准备迎接欧洲联合债券发行以加强该地区防御的可能性,此前美国官员表示他们准备提供的支持是有限度的。  意大利国债跑赢地区其他国债  货币市场维持对欧洲央行降息的押注不变,预计3月份降息24个基点,年底前料降息77个基点。  尽管

    2025年02月18日
    29
  • 黄金投资必看!华源证券谈伦敦金定价机制与沪金投资要点

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  2025年以来,黄金价格依旧“牛气冲天”,黄金投资呈现出一派火热景象。新浪财经特邀华源金属新材料联席首席分析师张明磊(金麒麟分析师)、分析师陈婉妤做客直播间,为投资者解读黄金投资要点。直播详情>>  在

    2025年02月19日
    35
  • 利华控股集团公布2024年业绩 股东应占溢利约1714.48万美元同比增长9.77%

      利华控股集团(01346)公布2024年业绩,收益约2.23亿美元,同比增加约6.9%;母公司拥有人应占溢利约1714.48万美元,同比增长9.77%;每股盈利2.7美分,末期股息每股7港仙。  公告称,收益增加主要由于集团成功赢得新客户;及与现有客户在多个产品类别中,实现更深入的渗透及提高

    2025年02月27日
    31
  • 曾准确预测黄金大涨的人,再发惊人预测!顶级趋势预测师警告美股恐崩盘

      24K99讯曾准确预言“黄金的黄金年”的美国顶级趋势预测师杰拉尔德·塞伦特(GeraldCelente)警告投资者,2025年可能会出现美国股票市场崩盘,这是由他所谓的过度炒作的人工智能(AI)投资造成的。  杰拉尔德·塞伦特是一位趋势预测师,著有畅销书《2000年趋势》、《趋势跟踪:远

    2025年03月03日
    28
  • 百度集团-SW计划发行本金总额不超20亿美元的可交换债券

      百度集团-SW(09888)发布公告,拟根据《1933年美国证券法》(经修订)项下的S规例,于美国境外以离岸交易方式向非美国人士发行本金总额不超过20亿美元的2032年到期可交换债券,受市场条件及其他因素所规限。  该等债券将参考携程集团有限公司(联交所:9961)于香港联合交易所有限公司上

    2025年03月08日
    25
  • 人民日报和音:中国经济航船必将乘风破浪、行稳致远

      中国经济航船必将乘风破浪、行稳致远(和音)  《人民日报》(2025年03月13日 第 03 版)  保持战略定力,集中精力办好自己的事,推动中国经济航船继续乘风破浪,中国的发展信心坚定  今年全国两会期间,中国宣布一系列利好政策,政策“工具箱”既展现出宏观调控的定力和智慧,也充满民生温度

    2025年03月13日
    19

发表回复

本站作者后才能评论

评论列表(4条)

  • adminc
    adminc 2025年04月05日

    我是竹日号的签约作者“adminc”!

  • adminc
    adminc 2025年04月05日

    希望本篇文章《中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地》能对你有所帮助!

  • adminc
    adminc 2025年04月05日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • adminc
    adminc 2025年04月05日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们