国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关键路径。随着DeepSeek R1开源引爆技术热潮,字节、阿里以及科大讯飞等国内主流大模型企业纷纷加码MoE架构创新,从通信优化到国产算力适配,一场围绕效率与生态的竞逐赛已然展开。

  3月1日,DeepSeek发布了“开源周”后的“彩蛋”,首次公布了模型降本增效的技术细节以及理论上高达545%的利润率。“彩蛋”显示,DeepSeek的671B参数模型在处理每个问题时,实际被激活的专家模型参数仅约37B,算力需求降低至传统架构的约二十分之一。

国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案

  MoE架构虽然能有效降低算力消耗,但在分布式训练过程中,仍然面临着跨设备通信开销巨大的挑战。有鉴于此,字节跳动豆包大模型团队于3月10日推出了针对MoE架构的通信优化系统COMET。据介绍,该系统采用细粒度计算与通信重叠技术,在大规模MoE模型上实现了单层1.96倍的加速效果,端到端平均效率也提升了1.71倍。

  在这场技术角逐中,另一互联网巨头阿里巴巴也通过开源策略持续扩大声量。3月6日,阿里云发布并开源了全新的推理模型通义千问QwQ-32B。阿里云称,该模型采用密集架构(Dense),尽管参数仅为32B,但性能却能与满血版DeepSeek R1这类混合专家模型(MoE)相媲美。

  诚然,DeepSeek等国产大型模型在算法上实现了诸多引领行业的创新,并且都选择了开源,但它们背后所依赖的仍然是英伟达提供的强大算力。而作为发布国内唯一基于全国产化算力训推大模型的企业,科大讯飞则始终将重心放在国产算力的创新突破上。

  近日,科大讯飞与华为在国产算力领域取得重大进展,双方联合团队率先突破国产算力集群上MoE模型的大规模跨节点专家并行集群推理,这是继DeepSeek公布其MoE模型训练推理方案后,业界首个基于国产算力的全新解决方案。

  通过算子融合、混合并行策略和通信计算并行优化等一系列创新,科大讯飞在国产算力上实现了显著性能提升:单卡静态内存占用缩减至双机部署的1/4,效率提升75%,专家计算密度增加4倍,推理吞吐提升3.2倍,端到端时延降低50%。科大讯飞称,这一解决方案将应用于讯飞星火深度推理模型X1的训练加速,预期训练时推理效率将提升200%。

  从DeepSeek点燃开源之火,到字节、阿里争相技术共享,再到科大讯飞实现国产算力突破,国内MoE赛道已形成“效率迭代”与“自主可控”的双重叙事。开源模式虽对企业直接创收有影响,却能通过生态共建降低研发成本、扩大市场份额;而国产算力突破则关乎技术主权与供应链安全,在AI基础设施竞争白热化的当下,战略意义同样毋庸置疑。

本文来自作者[adminc]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/post/15234.html

(17)

文章推荐

  • 手机壁纸怎么选?有哪些好看的手机壁纸类型?

    手机壁纸怎么选?有哪些好看的手机壁纸类型?手机壁纸怎么选选择手机壁纸时,可以考虑以下几个因素:首先是个人喜好,比如喜欢的颜色、图案、风格等。如果你喜欢自然风景,可以选择美丽的山川、海洋等壁纸;如果你喜欢动漫,可以选择动漫角色的壁纸。其次是壁纸的分辨率,要确保与你的手机屏幕分辨率匹配,

    2025年01月22日
    61
  • 特朗普批波音:总统专机怎么还没造好

      2月17日消息,美国总统唐纳德·特朗普近日再次批评波音公司,原因是他首个任期内就批准的新总统专机项目至今没有完成。  美联社15日援引白宫官员的话报道,特朗普在佛罗里达州棕榈滩国际机场“一架新的波音飞机上查看新的硬件设备和技术”,这次视察“凸显新的‘空军一号’未能按承诺准时交付”。  另据美

    2025年02月17日
    28
  • 短端收益率曲线倒挂,银行“二永债”发行规模骤降80%,近期交易难度提升

      财联社2月21日讯(编辑杨斌)债市短端收益率曲线的倒挂现象也蔓延到了银行二永债,而一级市场上,今年已发行二永债的规模仅为去年同期的六分之一。  业内分析认为,当前短久期银行资本债更具性价比,但近期债市波动加大,二永债交易难度所抬升,需关注资金面宽松信号。  春节假期后,二永债加速调整。Wi

    2025年02月21日
    32
  • “百亿影帝哪吒”养肥一批盗版商:定制最快3天出货,有店铺卖了200万

      转自蓝鲸财经  记者陆鹏鹏  昨日晚间,《哪吒之魔童闹海》总票房(含预售)破130亿元,暂列全球票房榜第8位。自大年初一上映以来,《哪吒2》掀起观影热潮,不断创造新的票房纪录,影片中“哪吒、敖丙、结界兽、石矶娘娘”等角色也深受观众喜爱。  伴随着IP热度的飙升,正版周边供不应求,一些盗

    2025年02月23日
    28
  • 邦达亚洲:美联储降息预期重燃 美元指数失守106.00关口

    3月5日,纽约联储主席威廉姆斯周二表示,在对经济进行预测时,他已将美国总统特朗普推行的关税政策纳入考量,并预计物价将在不久后上涨。威廉姆斯表示,他此前一直在观望特朗普是否会兑现其关税承诺。而在周二,特朗普正式宣布对来自墨西哥和加拿大的商品征收25%的关税,并对中国商品额外加征10%关税。“目前,我已

    2025年03月05日
    25
  • 美联储会议前,黄金期货升至接近纪录水平

    专题:美联储利率决议来袭离下次降息究竟还有多远?  黄金期货上涨,在美联储会议前徘徊在历史高点附近。黄金期货上涨0.2%,至每盎司3046.70美元,此前在本交易日早些时候创下3052.40美元的历史新高。  SPAngel分析师在一份报告中表示,避险需求、各国央行持续购买黄金、美元走软

    2025年03月19日
    11
  • 奥克股份:公司环氧乙烷产品不涉及光刻胶

    证券日报网讯奥克股份3月21日在互动平台回答投资者提问时表示,公司环氧乙烷产品不涉及光刻胶,公司环氧乙烷产品下游有生产表活清洗剂的客户,可用于生产半导体清洗剂,来自该部分客户的营收较小,对公司收入和利润影响较小。

    2025年03月21日
    9
  • 博鳌亚洲论坛举行2025年度理事会会议

      来源:博鳌亚洲论坛  3月24日,博鳌亚洲论坛理事长潘基文在海南省博鳌主持召开论坛2025年度理事会会议,张军秘书长做了工作报告。  张军秘书长汇报了论坛过去一年的工作,表示在理事会坚强领导下,在东道国大力支持下,在博鳌大家庭和各方共同努力下,论坛各方面都展现出新的面貌。在战略上,进一步明

    2025年03月25日
    7
  • 赤裸裸地“挑衅”?美国副总统万斯官宣陪同妻子一起出访格陵兰岛

    专题:市场或将高位宽幅震荡机构建议维持“高低切换”思路财联社3月26日讯(编辑黄君芝)美国副总统万斯(J.D.Vance)周二宣布,他也将于周五前往格陵兰岛。此前特朗普政府宣布万斯之妻乌沙·万斯(UshaVance)将携一个美国代表团前往格陵兰岛,此举引发了格陵兰和丹麦官员的强烈反对。当天

    2025年03月26日
    11
  • 中国东方教育全年纯利增88%至5.13亿 早盘拉升涨超12%

      3月28日消息,港股中国东方教育早盘拉升涨超12%,成交额迅速突破3000万。  消息面上,中国东方教育昨日发布公告,截至2024年12月31日止年度,实现收入41.16亿元人民币,同比增加3.5%;毛利为21.15亿元人民币,同比增加10.8%;纯利为5.13亿元人民币,同比增加88.0%

    2025年03月28日
    10

发表回复

本站作者后才能评论

评论列表(4条)

  • adminc
    adminc 2025年04月05日

    我是竹日号的签约作者“adminc”!

  • adminc
    adminc 2025年04月05日

    希望本篇文章《国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案》能对你有所帮助!

  • adminc
    adminc 2025年04月05日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • adminc
    adminc 2025年04月05日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们