DeepSeek“卡爆了”如何解决?多家国产算力厂商已适配,主要面向推理

  近期,资本市场最热的话题当属DeepSeek(深度求索)。从美国硅谷到中国街头巷尾,人们纷纷讨论着DeepSeek对AI大模型行业带来的巨大影响。   DeepSeek话题...

  近期,资本市场最热的话题当属DeepSeek(深度求索)。从美国硅谷到中国街头巷尾,人们纷纷讨论着DeepSeek对AI大模型行业带来的巨大影响。

  DeepSeek话题的火热,也带动其官方网页和App访问量的上升。新用户的大量涌入令DeepSeek用户在使用其“深度思考”和“联网搜索”功能时常常遭遇“服务器繁忙”。不过好消息是,目前已有多家国产AI算力厂商宣布适配DeepSeek,比如华为昇腾、壁仞科技、天数智芯、摩尔线程、沐曦等。在不久的将来,流畅地使用DeepSeek的各种功能或许并不是一件难事。

  壁仞科技工作人员对《每日经济新闻》记者表示:“DeepSeek有结构上的微创新,但是还是LLM(大语言模型),所以推理适配起来并不难。”

  根据中信建投研报,DeepSeek的网页端访问量,从2024年10月至2024年12月,分别为245万、422万和1101万。DeepSeek于2025年1月10日上线官方App,自该App发布以来,第18天已达到1500万日活。

  2月4日,天数智芯官方微信号披露,在AI技术蓬勃发展的当下,芯片技术成为关键。DeepSeek R1的横空出世宛如一道闪电,强势冲破长期以来的技术壁垒,为中国AI行业注入全新活力。今日(2月4日),天数智芯与Gitee AI联合发布消息,在双方的高效协作下,仅用时一天,便成功完成了与DeepSeek R1的适配工作,并且已正式上线多款大模型服务,其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。

  天数智芯副总裁宋煜2月5日对《每日经济新闻》记者表示:“天数智芯的产品是通用GPU,在芯片设计的技术路线上和国际主流路线相近,在软件生态层面,天数的IXUCA软件栈兼容国际主流生态,所以适配DeepSeek的V2、V3、R1、Janus等模型版本非常顺利。”

  据其介绍:“目前天数已经完成了V3、R1、Janus等模型的推理适配工作,在公开数据的精度测试上也和论文相当。适配成功后,天数也和Gitee AI、并行计算、算力互联等合作伙伴一起上线了多款大模型服务。”

  无独有偶,华为计算于2月4日表示,潞晨科技携手昇腾,联合发布基于昇腾算力的DeepSeek R1系列推理API及云镜像服务。2月5日,华为官方微信号披露,2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验。

  摩尔线程也于2月4日表示,作为国产全功能GPU创新企业,摩尔线程快速实现对DeepSeek蒸馏模型推理服务的高效部署,旨在赋能更多开发者基于摩尔线程全功能GPU进行AI应用创新。

  可以看出,无论华为昇腾、天数智芯还是摩尔线程,均针对DeepSeek推理服务进行适配。

  随着DeepSeek带来大模型访问量的暴增,推理芯片或将爆发。浙商证券认为,DeepSeek训练和推理成本大幅降低将带来大模型和用户侧准入门槛的同步降低,不仅带来同等预算下模型侧的迭代加速,“低成本+高性能”的模型也会加速推动企业和个人用户对AI Agent、AI应用等的使用,从而推动AI商业化落地进程的显著提速,在此背景下,推理环节的算力需求将得到激发。

  而算力厂商壁仞科技、云服务厂商优刻得也强调推理效率的重要性。壁仞科技认为,推理效率已成为目前行业各公司发展的核心竞争力。凭借壁仞科技自主研发的壁砺TM系列产品出色的兼容性能,仅用数小时即完成对DeepSeek R1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型。为开发者提供高性能、低成本的大模型部署与开发解决方案。

  关于国产算力芯片适配DeepSeek的重要性,天数智芯副总裁宋煜表示:“目前,大模型生态上,训练部分主要依赖CUDA+NVIDIA GPU,国产GPU的适配仍需突破。与DeepSeek合作,能加速国产GPU芯片的深度学习框架优化、算子优化、分布式训练适配,降低国产AI企业的迁移成本,打造‘国产算力+国产大模型’的闭环生态。”

  宋煜认为:“DeepSeek等国产大模型厂商的成功,离不开强大的算力支持。我们的目标是提供稳定、可扩展、性价比高的GPU解决方案,推动国产大模型更快迭代、更高效部署。未来,我们可以进一步深化合作,包括联合优化AI训练框架、开发定制化AI加速方案,更高效的分布式推理引擎等。”

本文来自作者[admin]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/lxzx/202502-2750.html

(23)

文章推荐

  • 浙江专升本考试网有哪些功能?怎样利用它备考?

    浙江专升本考试网有哪些功能?怎样利用它备考?浙江专升本考试网的功能浙江专升本考试网通常具有以下一些主要功能:(1)考试信息发布:提供关于专升本考试的最新政策、报名时间、考试时间、考试大纲等重要信息。(2)备考资料下载:包括历年真题、模拟试题、复习资料等,帮助考生进行有针对性的

    2025年01月30日
    27
  • 拆解爆火的《哪吒2》:资本盛宴都有谁参加了?

      来源:翠鸟资本  2025年中国院线春节档可谓异常火爆。  春节档被誉为中国电影市场的“黄金档期”,长假效应推升观影需求,春节档可谓电影公司必争之地,属于重量级影片扎堆上映之时点。  电影《哪吒之魔童闹海》(以下简称《哪吒2》)自2025年1月29日上映以来,迅速引发观影热潮,取得了大超预

    2025年02月07日
    16
  • 美股震荡微跌,不断变化的税收政策对市场产生压制

      宏观经济方面,美国1月新增非农不及预期中位数。具体来看,美国2025年1月非农新增就业14.3万人,预期中值17万人,路透调查预期范围介于6万至25万之间。美国劳工统计局称,1月份南加州的山林大火和全国大部分地区的严寒天气对就业人数“没有明显影响”;但家庭调查显示,有57.3万人因天气原因未

    2025年02月10日
    21
  • 渤海银行三名“70后”副行长任职资格获批

      上证报中国证券网讯(记者马慜)2月10日,渤海银行公告称,该行于近日收到国家金融监督管理总局批复,李建国、齐君及邓蓓担任渤海银行副行长的任职资格获得核准,自2025年2月7日起履职。  2024年7月19日,渤海银行官网发布公告称,面向社会公开选聘渤海银行副行长3名。从新聘任的三名副行长的履

    2025年02月10日
    18
  • 电脑一体机开机步骤是什么?有哪些注意事项

    电脑一体机开机步骤是什么?有哪些注意事项电脑一体机开机步骤是什么电脑一体机的开机步骤通常如下:首先,确保一体机已连接电源适配器,并将适配器插入电源插座。然后,在一体机的机身或屏幕边框上找到电源按钮,通常带有电源标志。按下电源按钮,等待片刻,一体机的屏幕会亮起,系统开始启动。在

    2025年02月11日
    28
  • 2月14日操盘必读:影响股市利好或利空消息

    影响股市利好与利空消息  宏观新闻  1、央行发布2024年第四季度中国货币政策执行报告。报告表示,综合运用多种货币政策工具,保持流动性充裕,使社会融资规模、货币供应量增长同经济增长、价格总水平预期目标相匹配。报告还表示,强化逆周期调节,根据国内外经济金融形势和金融市场运行情况,择机调整优化政

    2025年02月14日
    12
  • 港股恒指收涨3.69%、科指收涨5.56% 科技股全线飙升!腾讯、京东、小米涨逾7%

      2月14日消息,港股三大指数集体飙升,截至收盘,恒生指数涨3.69%,报22620.33点,恒生科技指数涨5.56%,国企指数涨4.11%。盘面上,各大板块全线拉升,科网股齐涨,快手、京东、腾讯、小米涨超7%,美团、阿里巴巴涨超6%;AI医疗板块领涨,阿里健康涨超28%,医药外包概念股跟随

    2025年02月14日
    15
  • 长江证券:首予中国宏桥“买入”评级 全球布局全流程铝产业链 铝价中枢有望继续上升

      长江证券发布研报称,首次覆盖中国宏桥(01378),给予“买入”评级。中国宏桥作为全球铝产业链一体化强者,拥有庞大氧化铝与电解铝产能,其全流程布局保障经营稳健,灵活管理实现成本领先。未来铝价中枢有望继续上升,叠加供需紧平衡导致铝价波动变小,公司现金盈利空间更进一步打开,高股息长期投资价值脱颖而

    2025年02月17日
    9
  • 百亚股份:2024年营业收入达到32.55亿元,同比增长51.8%

    来源:Gangtise投研 百亚股份 2024年度业绩快报显示,公司营收和利润均实现显著增长。2024年,公司营业收入达到32.55亿元,同比增长51.8%;归属于上市公司股东的净利润为2.85亿元,同比增长19.7%。公司核心产品自由点收入30.37亿元,同比增长60.7%,其中益生菌系列等大健

    2025年02月19日
    4
  • 推饼子作弊手法

    在众多民间博彩游戏中,推饼子是一种比较常见的玩法。这种游戏往往在一些民间聚会或者特定的地下博彩场所出现。对于很多人来说,推饼子可能仅仅是一种带有娱乐性质的游戏,但在某些不良环境下,它却被一些人利用来谋取不正当利益,这其中就涉及到作弊手法的问题。一、推饼子作弊手法有哪些?推饼子这个游戏看似简单,但其作

    2025年02月22日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年02月23日

    我是竹日号的签约作者“admin”!

  • admin
    admin 2025年02月23日

    希望本篇文章《DeepSeek“卡爆了”如何解决?多家国产算力厂商已适配,主要面向推理》能对你有所帮助!

  • admin
    admin 2025年02月23日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年02月23日

    本文概览:  近期,资本市场最热的话题当属DeepSeek(深度求索)。从美国硅谷到中国街头巷尾,人们纷纷讨论着DeepSeek对AI大模型行业带来的巨大影响。   DeepSeek话题...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们