如何预期DeepSeek传言中的R2新模型

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   信息平权   路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  信息平权

  路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研究员Daya在2月初已经说过:RL还在早期,今年会看“显著进步”(significant progress)

  其实在r1论文中也提到过:由于目前RL训练数据还很少,R1的下个版本会大幅提升。

如何预期DeepSeek传言中的R2新模型

  也就是r1论文中的下图,以及论文所述:随着RL数据的增加,模型不仅解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力,比如“反思”、“探索不同方法”。这些能力不是人类设计,而是随着模型在RL环境中训练,自然涌现的。

如何预期DeepSeek传言中的R2新模型

  粗浅的理解,现在不需要算法上的巨大创新,按照目前路线+更多算力+DS如此强的infra能力,基于目前的V3基座模型,依然可以取得r2/r3。当看到RL提升边际放缓,再基于新的基座V4,继续做RL,进一步推进推理模型提升。也就是下面这张图:(左脚踩右脚示意图)

如何预期DeepSeek传言中的R2新模型

  而参考OpenAI的路线图,o3已经决定不发布完整模型,GPT-4.5也成了最后一个独立发布的基座模型,意味着GPT-5(混合模型)开始,越来越黑盒。说白了,以后无论是基座模型还是推理模型本身,都是“原料”而不是“最终产品”,CloseAI和Anthropic一定会雪藏。

如何预期DeepSeek传言中的R2新模型

  但DeepSeek要做的,就是在别人继续闭源的时候,继续开源。r2应该对标的是o3完整版,而V4至少应该对标GPT-4.5,基于V4+RL的模型,应该对标是未来的所谓“GPT-5”。因此合理预期应该是V4可能会加入多模态能力,但r系列依然是推理模型。且这个过程中,所有的“原料”全部开源,不仅原料开源,按照这次代码五连发,连制造原材料的“配方”都直接开源。

  这里面其实没有什么DeepSeek不知道的秘密,甚至在infra层面远超北美很多模型大厂。今天我们在讨论的:DeepSeek甚至可能比英伟达更懂如何使用GPU。而所谓Research上的创新,OpenAI o系列的灵感也来自于早已发表的“开源”paper,叠加自己的算力优势和工程探索实现。说到底没人全靠自己闭门造车,都受益于全世界“开源”研究或实践的喂养。

  因此说回来,相比于r2,大家反而应该更期待V4,因为这打开了推理模型另一个level天花板,开辟的是另一条全新跑道。r2是时间表上确定的事情,而V4会是一个惊喜。这都会在今年发生。

  (完)

  文章内容有删减

本文来自作者[adminc]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/post/10833.html

(27)

文章推荐

  • 在菲律宾出行交通费贵吗?交通费 2 菲律宾情况一览

    在菲律宾出行交通费贵吗?交通费2菲律宾情况一览在菲律宾出行交通费贵吗?在菲律宾,出行的交通费用会因不同的交通方式和地区而有所差异。(1)公共汽车:公共汽车的费用通常较为低廉,但可能不太舒适。(2)吉普尼:这是菲律宾常见的交通工具,价格相对便宜,但可能会比较拥挤。(

    2025年02月06日
    60
  • 魔兽世界魔兽nga论坛

    一、NGA论坛在《魔兽世界》玩家群体中的地位《魔兽世界》,这款由暴雪娱乐公司推出的大型多人在线角色扮演游戏(MMORPG),自问世以来便吸引了全球无数玩家的热情参与。在这个充满奇幻与冒险的虚拟世界里,玩家们组建公会、挑战副本、探索未知领域,共同书写着属于自己的艾泽拉斯传奇。而在《魔兽世界》庞大的玩家

    2025年02月09日
    64
  • 十三张怎么样必胜

    在纸牌游戏的世界里,十三张是一款充满策略与趣味的游戏。很多玩家都怀揣着一个共同的目标:稳赢。那么,十三张怎么稳赢呢?这可不像表面看起来那么简单,背后涉及到诸多的技巧与策略。要深入探讨十三张稳赢的方法,首先得了解一下十三张这个游戏的背景。十三张起源于中国民间,有着相当长的历史。在过去,它是人们茶余饭后

    2025年02月10日
    44
  • 太力科技IPO获批

      来源:广州日报新花城  2月24日,中国证券监督管理委员会批复同意国家级专精特新“小巨人”企业广东太力科技集团股份有限公司(以下简称“太力科技”)首次公开发行股票注册。这家总部位于广东省中山市石岐的企业,以“科技创新”为引擎,用自身实践诠释了新质生产力的时代内涵。  太力科技深耕新材料与

    2025年02月27日
    29
  • 视频|美乌总统当众大吵梗概

      来源:神蜜人物

    2025年03月01日
    21
  • 花旗:维持贝壳-W“买入”评级 上调目标价至72.86港元

      花旗发布研报称,维持贝壳-W(02423)“买入”评级,目标价由60.72港元上调至72.86港元。该行重申贝壳为首选,确信内房市场稳定将推动集团的GTV前景。贝壳首季成交表现强劲,并可能在3月获纳入港股通,因此该行对其展开30日正面催化观察。  花旗表示,贝壳受多项利好因素带动,包括主要城

    2025年03月07日
    20
  • 净资产为负,这家A股公司将被*ST,明日复牌!

      每经编辑毕陆名  3月18日晚间,新研股份(SZ300159,股价:2.33元;总市值:35.00亿元)发布2024年年报,公告显示,2024年公司共实现营业收入6.65亿元,同比下降44.16%;归属于上市公司股东的净利润-3.19亿元;基本每股收益-0.2181元。  同日,新研股

    2025年03月19日
    12
  • 鞍钢股份与鞍钢工程拟向鞍钢能源合共增资1亿元

      鞍钢股份(00347)公布,于2025年3月28日,该公司与鞍钢工程及鞍钢能源订立增资协议,将鞍钢能源的注册资本由人民币2.01亿元按比例增加至3.01亿元,以推进凌钢焦炉煤气制LNG项目,据此公司同意以现金方式向鞍钢能源股本增资共人民币6000万元。公司及鞍钢工程目前分别持有鞍钢能源60

    2025年03月31日
    7
  • 隔夜要闻:美股一季度收跌 现货黄金突破3100美元 特朗普设立投资办公室 诺和诺德暴跌 亚马逊推出Nova Act

      欲览更多环球财经资讯,请移步7×24小时实时财经新闻  市场  收盘:美股一季度录得跌幅市场聚焦特朗普关税影响  3月31日美股成交额前20:日本将实施新规限制苹果谷歌垄断行为  周一热门中概股涨跌不一联电涨9.16%,文远知行跌6.54%  周一美国WTI原油收高逾3%市场关

    2025年04月01日
    6
  • 消息称马斯克将很快退出DOGE职位,白宫发言人回应

    专题:A股成交量跌破万亿4月结构性机会如何把握  据知情人士称,美国总统特朗普已告诉他的核心圈子,包括他的内阁成员,埃隆·马斯克将在未来几周内退出他目前在政府效率部的角色。  据三名不愿透露姓名的特朗普内部人士透露,特朗普仍然对马斯克和他的政府效率部(DOGE)的工作感到满意,但两人最近几天都

    2025年04月03日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • adminc
    adminc 2025年04月05日

    我是竹日号的签约作者“adminc”!

  • adminc
    adminc 2025年04月05日

    希望本篇文章《如何预期DeepSeek传言中的R2新模型》能对你有所帮助!

  • adminc
    adminc 2025年04月05日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • adminc
    adminc 2025年04月05日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   信息平权   路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们