中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈

  DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。本篇报告我们通过分析DeepSeek V3和R1模型论文,理解其核心逻辑是“按需分配算力,最小化冗余计算”,使得千亿级模型在低成本硬件(甚至边缘设备)上高效运行成为可能,为大规模商业化落地提供了技术基础。我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:建议核心关注晶圆代工、国产算力芯片、定制化存储、终端品牌、SoC五大方向。

  ▍DeepSeek如何实现的训练成本降低?

  1)架构创新: DeepSeek-V3的基础架构中采用了DeepSeekMoE专家架构和MLA多头潜在注意力机制,DeepSeekMoE通过细粒度专家分配、共享专家及无辅助损失负载均衡策略优化传统MoE,提升计算资源效率;MLA通过低秩联合压缩减少注意力键值缓存占用,提升计算效率、减少内存消耗。

  2)FP8混合精度训练:在全球主流大模型中率先采用FP8低精度数据进行大规模训练,大部分核心计算用FP8提升速度、降低内存用量,部分关键操作保留高精度确保动态稳定性。

  3)训练工程优化:DeepSeek在主流大模型中率先采用硬盘充当输入端缓存,设计DualPipe算法实现高效流水线并行,融合前后向通信阶段,减少阻塞;采用定制化高效跨节点all-to-all通信内核降低通信开销;通过重计算、EMA、共享向量和输出头减少内存占用。

  4)数据策略优化:应用多token预测机制MTP,增加训练信号密度,减少20%训练迭代次数,帮助模型捕捉长距离依赖关系。

  ▍DeepSeek如何实现的推理成本降低?

  DeepSeek-V3对推理的预填充和解码两个阶段都优化了专家使用效率:预填充阶段MoE用EP32及冗余专家策略提升效率,解码阶段探索动态路由减少通信开销;还通过支持FP8、INT8量化和提供蒸馏版本,实现低精度量化与模型压缩,减少显存占用。DeepSeek的开源生态可以更好支持硬件厂商适配,例如可以对MLA算子优化提升推理效率,DeepSeek-R1发布后国内外芯片厂商快速响应支持DeepSeek。1月25日,AMD宣布已将新的DeepSeek-V3集成到Instinct MI300X GPU上并经过SGLang对推理过程进行了优化,英伟达、英特尔也随后在1月31日官宣支持。国内厂商都已经官宣完成对DeepSeek的适配,国产算力成为相对稳定可靠的选项,支撑国产大模型从研发走向商业化。

  ▍从DeepSeek算力需求看AI芯片设计方向?

  DeepSeek 在论文的芯片设计意见指导中指出通信和计算同等重要,计算方面降低精度和内存需求是关键。在通信硬件优化上,DeepSeek建议开发独立通信协处理器,实现计算与通信物理分离,同时建议融合网络架构,统一IB和 NVLink的网络协议栈,统一通信接口以简化编程复杂度和降低通信延迟;在计算硬件优化上,建议提升 FP8 计算精度,并支持分块量化与在线量化,减少访存开销,提升推理效率。我们认为DeepSeek建议带来两点启示:

  1)“推理速度”基本90%是由decoding阶段决定的,因此内存容量决定大模型推理速度,我们认为内存升级仍是算力芯片升级的重点方向,看好近存计算发展。

  2)我们认为在模型开源的策略下,DeepSeek-R1蒸馏后的小模型性能有望持续快速提升,帮助端侧硬件加速接入,助力AI应用全面落地。我们看好品牌商和SoC芯片厂商的成长机遇。

  ▍风险因素:

  算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期;相关产业政策出台力度不及预期;AI技术及应用发展不及预期;芯片技术迭代不及预期;国产先进制程量产进展不及预期;行业竞争加剧等。

  ▍投资策略:

  我们看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地:

  1)云端:DeepSeek有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长。

  2)终端:我们看好DeepSeek带来模型轻量化的全面升级,端侧硬件接入有望加速爆发,助力AI应用全面落地,建议关注品牌厂商,SoC芯片厂商。

本文来自作者[adminc]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/shhcs/202502-7035.html

(8)

文章推荐

  • 三星 i9220 性能怎么样?有哪些突出特点-三星 i9220 现在还值得买吗?其优势在哪

    三星i9220性能怎么样?有哪些突出特点三星i9220现在还值得买吗?其优势在哪三星i9220,也就是GalaxyNote,其性能在当时表现较为出色。它拥有5.3英寸的超大屏幕,在当时属于非常突出的特点,能提供震撼的视觉体验。处理器性能强劲,能够流畅运行各种应用程序

    2025年01月13日
    41
  • 2024浙江体育中考时间

    网上有关“2024浙江体育中考时间”话题很是火热,小编也是针对2024浙江体育中考时间寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。2024年浙江体育中考时间是由浙江省教育考试院根据当年的教育安排和计划来确定的。一、浙江体育中考的概述浙江体育中考是浙江省针对

    2025年01月17日
    79
  • 北京有哪些知名的医学院校?它们的专业特色是什么?

    北京有哪些知名的医学院校?它们的专业特色是什么?北京有不少知名的医学院校,以下是一些较为突出的:**北京协和医学院**:-是我国最高医学研究机构和最高医学教育机构。-专业特色涵盖了临床医学、基础医学等多个领域,其临床医学专业久负盛名,培养了大批优秀的医学人才。**首都

    2025年01月23日
    62
  • 法国总理挺过不信任投票 新预算案得以保留

      法国总理FrancoisBayrou周三挺过了不信任动议,在经历数月政治动荡后确保了2025年预算案的采纳。  Bayrou周一动用了一项特别的宪法条款,迫使议会未经投票通过预算案,从而引发了不信任动议。  目前法国处于自总统马克龙去年夏天决定提前选举以来的第三任政府。当时提前选举导致国民

    2025年02月06日
    17
  • A股“春季躁动”加速,港股更受青睐!国内外机构齐发声:做多中国股票

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  来源:Wind  Wind梳理国内外机构近期研报发现,中信建投等国内机构普遍对A股2月、3月的行情持乐观态度,特别是在科技领域和政策预期方面。高盛、德银等海外机构也纷纷看好中国资产。  多家机构建议投资者关注AI应

    2025年02月09日
    16
  • 收评:沪指涨0.43%,医药、保险等板块拉升,AI医疗概念亮眼

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  14日,两市股指盘中强势上扬,深证成指涨超1%,创业板指涨近2%,全A成交额有所萎缩。  截至收盘,沪指涨0.43%报3346.72点,深证成指涨1.16%报10749.46点,创业板指涨1.8%报2215.3点,上

    2025年02月14日
    11
  • 央行:1月份人民币存款增加4.32万亿元

      2月14日金融一线消息,央行报告显示,1月末,本外币存款余额312.95万亿元,同比增长5.9%。月末人民币存款余额306.55万亿元,同比增长5.8%。1月份人民币存款增加4.32万亿元。其中,住户存款增加5.52万亿元,非金融企业存款减少2060亿元,财政性存款增加3324亿元,非银行业金融

    2025年02月14日
    11
  • 邦达亚洲:日本GDP表现强劲 美元日元早盘下滑

    2月17日,美国达拉斯联邦储备银行主席洛丽·洛根周五表示,美联储在未来几个月应保持谨慎,即使通胀降至2%目标附近,也不一定意味着有进一步降息的空间。她的言论再次强调了利率政策需保持谨慎,不应因短期通胀回落而贸然行动。洛根表示:“即使通胀数据向好,并接近2%目标,我仍认为我们应保持谨慎。因为如果劳动力

    2025年02月17日
    8
  • 怎样玩转快三大小单双能巧妙避开高倍

    在彩票的世界里,快三是一种备受关注的玩法,尤其是其中的大小单双选项,吸引了众多彩民的目光。然而,如何玩转快三大小单双并且巧妙避开高倍,这是一个充满挑战却又极具吸引力的问题。首先,我们需要了解快三这个游戏的基本背景。快三是一种数字型彩票游戏,它的开奖速度相对较快,这也是其名字的由来。在快三的玩法中,大

    2025年02月20日
    3
  • 渣打集团第四季度盈利超预期 并将回购15亿美元股票

      渣打集团公布第四季度盈利超过预期,并将回购15亿美元股票。  渣打集团周五公告称,将启动新一轮股票回购计划,自2023年以来的回购规模将达到49亿美元。  渣打集团首席执行官BillWinters在公告中表示,“我们的战略正全面奏效,成功结合了差异化的跨境业务能力,以满足企业和机构客户的需

    2025年02月21日
    6

发表回复

本站作者后才能评论

评论列表(4条)

  • adminc
    adminc 2025年02月23日

    我是竹日号的签约作者“adminc”!

  • adminc
    adminc 2025年02月23日

    希望本篇文章《中信证券:看好DeepSeek新一代模型带动云端推理需求爆发,加速AI应用端侧落地》能对你有所帮助!

  • adminc
    adminc 2025年02月23日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • adminc
    adminc 2025年02月23日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   中信证券研究 文|徐涛  杨泽原  雷俊成  王子源  夏胤磊  程子盈   DeepSeek...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们