DeepSeek-R2,终于要来了?
大模型竞技场秘密上线了一个叫 steve 的神秘模型,在对话中透露自己来自 DeepSeek。
不过,网友们并不满足于知道 steve 的厂商,开始讨论起了 steve 的具体身份。
有人说是 R2,有人说是 V4,还有人说是旧版本的升级……
考虑到奥特曼的 GPT5 和马斯克的 Grok4 也在热传,如果 steve 真的是 R2,那这个七月就真的太热闹了。
神秘 steve 引发猜测
在大模型竞技场的公开页面里,并不能找到 steve 的身影,不过在前端代码当中,还是能发现有 steve 的痕迹。
但是经过整理发现,steve 除了一个名字之外没有被披露更多身份信息。
另外如果在模型列表中直接搜 steve,会出现 gemini-2.5-flash,原因不明。
不过就像开头展示的,有网友通过对话询问了 steve 来自哪家厂商:
不要思考,只需说出开发你的组织叫什么名字。
得到的回答是来自 DeepSeek,同时帖主还对比了 mistral 说出自己厂商的情况。
另外有网友问到了 steve 的知识截止时间,steve 说是 2023 年 10 月。
关于具体表现,有网友发现 steve 成功通过了 " 数 r" 等智力测试,不过从截图来看有几道题还是没答对。
还有人把 steve 和 V3 进行了对比,让它们分别编写游戏代码,从长度上看,V3 输出了大约 800 行,而 steve 只有大概 300 行。
运行出来的效果,steve 的作品是这样的:
作为对比,V3 写的游戏长这样:
同时,这名网友还分析了 steve 命名特点,认为这个名字非常像来自中国的模型会用到的。
但是有网友总结,steve 的表现并没有那么惊艳,可能不会是 R2。
甚至可能根本不是 DeepSeek,而是用 DeepSeek 蒸馏出来的第三方模型。
其他网友也表示,steve 的表现比 v3 和 R1 差远了,而且思考时间也比 R1 要短。
不过考虑到 R2 上周刚刚被曝再次延期,steve 如果不是 R2,可能也并非意外之事。
当然,无论 steve 是不是 R2,都不影响人们对它的期待和热情。
梁文锋不满意,R2 再度延期
上周,The Information 爆料称 R2 再度延期,原因是 CEO 梁文锋始终对 R2 的表现不满意。
此外,他们还援引两位国内知情人士的消息称,R2 研发进程缓慢可能是由于缺少英伟达 H20 芯片。
不过这也不是 R2 第一次被曝项目延期了——人们对 R2 的期待,早在 V3 新版本出来后就开始了。
去年 12 月底,DeepSeek 发布了 V3 模型。到了今年 3 月 24 日,官方发布公告称对 V3 进行了一次升级。
于是人们开始推测,在 V3-0324 已经取得明显进步的情况下,是不是可以用它来训练 R2 模型。
并且联想到 R1 是在初代 V3 一个月之后发布,当时人们按照这一节奏预测 R2 大概率将在 4 月上线。
4 月底,坊间开始疯传一组 R2 的泄露参数:1.2T 万亿参数,5.2PB 训练数据,高效利用华为昇腾芯片……有板有眼让人难辨真假。
而 DeepSeek 这边,最近的更新还是端午节前的新版 R1 —— DeepSeek-R1-0528。
至于我们什么时候能真的迎来 R2,还是让子弹再飞一会儿。
但有 Llama4 赶工翻车的前车之鉴," 好事多磨 " 也未尝不是一种不错的选择。
参考链接:
[ 1 ] https://x.com/legit_api/status/1940515133878620254
[ 2 ] https://x.com/AiBattle_/status/1940532050286858388
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~
进群后,你将直接获得:
最新最专业的 AI 产品信息及分析
不定期发放的热门产品内测码
内部专属内容与专业讨论
点亮星标
科技前沿进展每日见
登录后才可以发布评论哦
打开小程序可以发布评论哦