阿里巴巴的Qwen AI模型助力斯坦福、伯克利能够开发出低成本推理模型

  斯坦福的S1和伯克利的TinyZero是研究人员越来越多地使用阿里巴巴技术降低AI训练成本的两个例子。随着美国计算机科学家(包括著名的华裔“AI教母”李飞飞)利用阿里巴巴的...

  斯坦福的S1和伯克利的TinyZero是研究人员越来越多地使用阿里巴巴技术降低AI训练成本的两个例子。随着美国计算机科学家(包括著名的华裔“AI教母”李飞飞)利用阿里巴巴的开源Qwen2.5模型,以不到50美元的成本训练出一种新的推理模型,在中国DeepSeek取得突破性成功后,生产最便宜且性能顶尖的人工智能(AI)模型的竞赛正在升温。

  根据上周发表的一篇研究论文,S1推理模型是由斯坦福大学(李飞飞工作的地方)和华盛顿大学的研究人员在阿里巴巴的Qwen2.5-32b-Instruct模型基础上开发的。

  阿里巴巴模型的能力是中国正在缩小与领先美国AI企业差距的最新证据。此前,DeepSeek发布的低成本、高性能开源模型已引起全球关注。阿里巴巴在香港上市的股票本周一上涨了6%。

  根据论文,S1模型在经过1000个精心设计的问题答案和从谷歌Gemini思维实验模型中蒸馏的“思维过程”训练后,在数学和编程技能上超越了OpenAI的o1-preview模型。

  根据研究中提到的计算,仅用于开发S1的图形处理单元(GPU)运行成本可能低至14美元。论文指出,该模型在16个Nvidia H100上训练了26分钟。这些芯片可以以每小时2美元的价格租用。

  加州大学伯克利分校的计算机科学家Pan Jiayi表示,以如此低的成本(大约相当于纽约熟食店一个三明治的价格)训练一个强大的推理模型的关键在于基础模型。“基础模型的质量是关键,”他说。

  Pan Jiayi的团队在启动一个项目时得出了这一结论。该项目成功复制了DeepSeek-R1模型在倒计时游戏(一种需要模型达到目标数字的算术运算)和乘法任务中的推理能力。该团队的TinyZero项目也是在一系列Qwen2.5模型的基础上构建的,成本约为30美元。

  通过使用强化学习,Pan Jiayi的团队从使用5亿参数的Qwen2.5版本升级到70亿参数的版本。Pan Jiayi在X(前身为Twitter)上表示,一旦使用15亿参数的模型,它就开始“学习搜索、自我验证和修正解决方案,从而使其能够获得更高的分数”。

  S1和TinyZero都选择了阿里巴巴的Qwen2.5,因为该模型的开源代码允许任何人访问和修改基础模型,并且其性能表现出众。

  阿里巴巴的云计算部门于去年9月首次推出Qwen2.5系列,参数规模从5亿到720亿不等。参数是指AI系统在训练过程中存在的变量。AI模型的复杂性和有效性在很大程度上取决于训练过程中涉及的参数规模。

  在发布时,该系列最大的模型Qwen2.5-72b的表现优于其他开源竞争对手模型,包括Meta Platforms的Llama3.1-405b,尽管后者规模更大。

  根据当时的基准测试,其性能也与微软支持的OpenAI和亚马逊支持的Anthropic的顶级闭源模型相当。

  Qwen2.5是全球最大的深度学习和AI模型社区Hugging Face上去年下载量最多的模型,取代了Meta的Llama系列,成为全球研究人员和开发人员的首选。这也解释了为什么越来越多的全球计算机科学家正在通过在Qwen模型上进行实验来增强AI系统。

  OpenAI的GPT系列等顶级模型并非开源,因此无法下载用于此类研究。

  在本月早些时候发表的一篇论文中,上海交通大学的计算机科学家展示了一种使用高质量训练样本来增强AI系统推理能力的方法,该实验也以Qwen模型为基础。

  加拿大滑铁卢大学计算机科学助理教授Chen Wenhu表示:“Qwen模型确实有一些神奇之处。”

  Chen Wenhu在X上写道,他的团队尝试使用相同质量的数据方法训练其他模型,但几乎没有取得任何进展。

本文来自作者[adminc]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/post/5097.html

(54)

文章推荐

  • 特朗普政府将买断方案扩大到CIA以外更多情报机构

      据报道,除了中央情报局(CIA)之外,美国政府还向至少四家情报机构的员工提出了买断方案。这是特朗普政府缩减美国联邦政府工作人员的努力的最新进展。  这四家机构分别是美国国家情报总监办公室、国家安全局、国家地理空间情报局和国家侦察局。这些机构的发言人周三证实,他们的员工收到了买断要约。  受影

    2025年02月06日
    39
  • 陆凯枫:多头大举进攻 直奔三千而行

    2月7日,国际现货黄金周初小幅度回踩以后,直接快速拉升至2882的高位,回踩的最低位给到了2760附近,如果准确点说下方最重要的支撑位是中线2717附近,可是回踩到这个位置的难度已经是很高了。目前整体趋势仍旧是震荡上行,只是目前的回落可能会有一定的调整,下方的回落程度目前并没有跌破2830,只有进一

    2025年02月07日
    36
  • 2023洛克王国回归宠物哪个值得买

    在洛克王国这个充满奇幻与冒险的游戏世界里,宠物一直是玩家们关注的焦点。无论是新手玩家渴望建立强大的宠物战队,还是老玩家希望重温旧时光并扩充自己的宠物阵容,回归宠物的选择都至关重要。一、洛克王国回归宠物的背景与吸引力洛克王国自上线以来,已经经历了多年的发展。随着游戏的不断更新,新的宠物层出不穷,而那些

    2025年02月11日
    58
  • 工商银行:中国证券金融股份有限公司66.7%股权拟划转至汇金公司

      2月14日金融一线消息,工商银行发布公告,公司于2025年2月14日接到中央汇金投资有限责任公司(简称汇金公司)通知,中国证券金融股份有限公司66.7%股权拟划转至汇金公司。根据香港《证券及期货条例》,汇金公司已就持有公司股份情况在香港提交披露。根据《证券法》等监管要求,同步在A股发布本次公告。

    2025年02月14日
    33
  • 2024年非上市寿险缘何大赚:投资收益+新会计准则

      来源:中国经营报  本报记者陈晶晶北京报道  继A股上市保险公司发布业绩预喜后,非上市人身险公司2024年整体净利润情况亦好于2023年。  最新数据显示,已披露2024年四季度偿付能力报告的60家非上市人身险公司合计实现保险业务收入约1.13万亿元,同比增长12.2%。已披露净利润的

    2025年02月15日
    32
  • 大爆发!A股最热板块,逾30股涨超10%!

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  今日早盘,A股小幅上扬。盘面上,AI医疗概念、教育培训、电信服务、东数西算等板块涨幅居前,影视院线、黄金、煤炭、家用电器等板块跌幅居前。  总体上看,科技成长股表现较好,北证50指数盘中一度涨逾2%,科创50也涨超1

    2025年02月17日
    29
  • 第二批22家险企将于2月28日接入“车险好投保”平台

      2月27日金融一线消息,中国保险行业协会、上海保险交易所发布关于新能源汽车领域“车险好投保”平台第二批公司上线运行的公告。公告指出,“车险好投保”平台第二批公司将于2025年2月28日上午10:00正式接入。  “车险好投保”平台为高赔付风险新能源汽车提供线上化的便利投保窗口,新能源车主可通过

    2025年02月27日
    31
  • 智慧农业:积极关注国家农业信息化产业相关政策

    证券日报网讯智慧农业3月11日在互动平台回答投资者提问时表示,公司会积极关注国家农业信息化产业相关政策,如有重大事项公司将按照相关规则及时进行披露。

    2025年03月11日
    25
  • 公司快评|公司及相关人合计拟被罚1470万元 中青宝当痛定思痛彻底整改

    登录新浪财经APP搜索【信披】查看更多考评等级  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  每经评论员贾运可  近日,中青宝(维权)(SZ300052,前收盘价18.17元,市值47.58亿元)发布公告称,因涉嫌2019年至2021年年度报告存在虚假记载,

    2025年03月17日
    14
  • “木头姐”谈特斯拉销量大跌:经济前景影响需求,不是马斯克个人原因

      方舟投资管理公司创始人兼CEO凯茜·伍德认为,特斯拉最近的销量下滑部分原因可能是对经济的普遍担忧,而不仅仅是因为该公司CEO埃隆·马斯克的政治行为引发的消费者反弹。  伍德在3月14日发布在方舟网站上的一段视频中说:“现在,很明显,过去几个月的政治动态正在影响需求。我们还认为,经济前景正在影

    2025年03月26日
    7

发表回复

本站作者后才能评论

评论列表(4条)

  • adminc
    adminc 2025年04月05日

    我是竹日号的签约作者“adminc”!

  • adminc
    adminc 2025年04月05日

    希望本篇文章《阿里巴巴的Qwen AI模型助力斯坦福、伯克利能够开发出低成本推理模型》能对你有所帮助!

  • adminc
    adminc 2025年04月05日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • adminc
    adminc 2025年04月05日

    本文概览:  斯坦福的S1和伯克利的TinyZero是研究人员越来越多地使用阿里巴巴技术降低AI训练成本的两个例子。随着美国计算机科学家(包括著名的华裔“AI教母”李飞飞)利用阿里巴巴的...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们