如何预期DeepSeek传言中的R2新模型

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   信息平权   路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  信息平权

  路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研究员Daya在2月初已经说过:RL还在早期,今年会看“显著进步”(significant progress)

  其实在r1论文中也提到过:由于目前RL训练数据还很少,R1的下个版本会大幅提升。

如何预期DeepSeek传言中的R2新模型

  也就是r1论文中的下图,以及论文所述:随着RL数据的增加,模型不仅解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力,比如“反思”、“探索不同方法”。这些能力不是人类设计,而是随着模型在RL环境中训练,自然涌现的。

如何预期DeepSeek传言中的R2新模型

  粗浅的理解,现在不需要算法上的巨大创新,按照目前路线+更多算力+DS如此强的infra能力,基于目前的V3基座模型,依然可以取得r2/r3。当看到RL提升边际放缓,再基于新的基座V4,继续做RL,进一步推进推理模型提升。也就是下面这张图:(左脚踩右脚示意图)

如何预期DeepSeek传言中的R2新模型

  而参考OpenAI的路线图,o3已经决定不发布完整模型,GPT-4.5也成了最后一个独立发布的基座模型,意味着GPT-5(混合模型)开始,越来越黑盒。说白了,以后无论是基座模型还是推理模型本身,都是“原料”而不是“最终产品”,CloseAI和Anthropic一定会雪藏。

如何预期DeepSeek传言中的R2新模型

  但DeepSeek要做的,就是在别人继续闭源的时候,继续开源。r2应该对标的是o3完整版,而V4至少应该对标GPT-4.5,基于V4+RL的模型,应该对标是未来的所谓“GPT-5”。因此合理预期应该是V4可能会加入多模态能力,但r系列依然是推理模型。且这个过程中,所有的“原料”全部开源,不仅原料开源,按照这次代码五连发,连制造原材料的“配方”都直接开源。

  这里面其实没有什么DeepSeek不知道的秘密,甚至在infra层面远超北美很多模型大厂。今天我们在讨论的:DeepSeek甚至可能比英伟达更懂如何使用GPU。而所谓Research上的创新,OpenAI o系列的灵感也来自于早已发表的“开源”paper,叠加自己的算力优势和工程探索实现。说到底没人全靠自己闭门造车,都受益于全世界“开源”研究或实践的喂养。

  因此说回来,相比于r2,大家反而应该更期待V4,因为这打开了推理模型另一个level天花板,开辟的是另一条全新跑道。r2是时间表上确定的事情,而V4会是一个惊喜。这都会在今年发生。

  (完)

  文章内容有删减

本文来自作者[adminc]投稿,不代表竹日号立场,如若转载,请注明出处:https://eodbgbl.cn/lxzx/202502-10833.html

(7)

文章推荐

  • 15分钟消除恐艾心理最简单三个步骤

    网上有关“15分钟消除恐艾心理最简单三个步骤”话题很是火热,小编也是针对15分钟消除恐艾心理最简单三个步骤寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一:不要太担心,不要吓自己,很痛苦的!恐艾就是没得艾滋但自己吓自己。人吓人,吓死人,更何况自己吓自己!请

    2025年01月22日
    44
  • 法律硕士招生院校有哪些?如何选择合适的院校?

    法律硕士招生院校有哪些?如何选择合适的院校?法律硕士招生院校有很多,以下是一些比较知名的院校:-中国人民大学-北京大学-清华大学-中国政法大学-华东政法大学-西南政法大学如何选择合适的院校:首先要考虑院校的法学学科实力和师资力量。可以通过了解院

    2025年01月24日
    44
  • 宁波交通广播都有哪些节目?其特色节目是什么?

    宁波交通广播都有哪些节目?其特色节目是什么?宁波交通广播拥有众多精彩节目。《欢乐同行》:这是一档早高峰节目,以轻松幽默的风格陪伴听众开启美好的一天。《爱上下班路》:在下班时段为听众带来轻松愉悦的氛围和丰富的资讯。特色节目之一是《高速夜未眠》,它在深夜时段为听众提供温暖的陪

    2025年01月27日
    34
  • 三连升!医疗ETF(512170)劲涨超2%,金域医学领涨!机构:基金持仓再创新低,底部配置价值凸显

      7日早盘,医疗板块连续第三日上扬,场内热门医疗ETF(512170)震荡走高,涨超2%,强势突破半年线和年线,实时成交额接近4亿元。  成份股方面,金域医学涨超6%居首,美年健康、迪安诊断、爱博医疗等多股涨超5%,权重股迈瑞医疗、泰格医药、爱尔眼科涨超3%。  值得关注的是,医药医疗公募基

    2025年02月07日
    21
  • 锰硅:短期看涨情绪仍存,中长期存风险

      来源:一德菁英汇  一德期货黑色金属分析师  今日(2月7日)锰硅2505主力合约收盘7312元/吨,涨2.84%,持仓量再创2505合约历史新高,达60万手以上。  假期归来,硅锰行情再度迎来快速拉涨走势,北方厂家报盘持续上调至6700-6800元/吨。主要逻辑仍为节前锰矿拉涨驱动

    2025年02月07日
    19
  • 什么样的麻将质量好

    在休闲娱乐的世界里,麻将无疑是一种深受大众喜爱的游戏。无论是家庭聚会、朋友小聚还是社区活动,麻将常常成为人们消遣时光的选择。于是,“什么样的麻将质量好”就成了众多麻友关心的问题。首先,我们来探讨什么样的麻将质量好耐打。麻将在使用过程中,洗牌、码牌、出牌等一系列动作都会对麻将牌产生磨损。质量好耐打的麻

    2025年02月08日
    23
  • 东风系、兵装系概念集体高开 东风股份等多股竞价涨停

    专题:科技类资产价值正在重估机构称行情仍将继续演绎  2月10日消息,东风股份、东风科技、湖南天雁、中光学、东安动力、长城军工竞价涨停,华强科技、长安汽车大幅高开。  消息面上,2月9日,多家东风系和兵装系上市公司发布公告称,其间接控股股东/控股股东或发生变更。公告显示,东风汽车集团有限公司、

    2025年02月10日
    28
  • AI医疗继续上攻,医疗ETF(512170)劲涨超2%!华大智造20CM涨停,金域医学、美年健康两连板

      10日早盘,AI医疗概念继续上攻,华大智造20CM涨停,金域医学、美年健康两连板,卫宁健康、华大基因大幅跟涨。ETF方面,医疗ETF(512170)持续拉升涨超2%,实时成交额近5亿元。  值得一提的是,此前3个交易日,医疗板块实现三连升,蛇年首周(2月5日-7日)医疗ETF(512170)

    2025年02月10日
    29
  • 首家药妆店落地意大利!亚马逊再试水实体零售

    亚马逊(AMZN.US)将在意大利米兰市中心开设一家美容和健康产品店,这是该公司在实体零售领域的最新尝试。AmazonParafarmacia&Beauty是该公司在意大利的首家实体零售店,将于当地时间2月12日开业。店内将提供更广泛的美容和个人护理产品,以及非处方药和准药品。据介

    2025年02月12日
    23
  • 美媒:特朗普政府将取消美国国际开发署90%以上对外援助合同

      中新网2月27日电据美联社报道,特朗普政府表示,将取消美国国际开发署90%以上的对外援助合同以及600亿美元的全球援助项目。  报道称,美国政府详述的削减计划将使美国国际开发署的幸存项目寥寥无几,倡导者们将在与美国政府的持续法庭斗争中试图挽救这些项目。  据报道,特朗普政府在美联社获得的一

    2025年02月27日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • adminc
    adminc 2025年02月28日

    我是竹日号的签约作者“adminc”!

  • adminc
    adminc 2025年02月28日

    希望本篇文章《如何预期DeepSeek传言中的R2新模型》能对你有所帮助!

  • adminc
    adminc 2025年02月28日

    本站[竹日号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • adminc
    adminc 2025年02月28日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   信息平权   路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研...

    联系我们

    邮件:竹日号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们