量子位 前天
全网疯传GPT-5泄露!首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

GPT-5 这回是真的要来了。

现在,全网都在 " 偶遇 "GPT-5。

不仅是 ChatGPT 上有踪迹:

而且在 MacOS 应用的模型列表中也发现了 GPT-5。

还有 Cursor、微软 Copilot 以及 OpenAI API 平台上,也都被网友捉到已经悄悄接入 / 测试 GPT-5。

这一大波泄露,大家对 GPT-5 的热情和好奇再次被重新拉回高点,还是奥特曼会玩啊。

连向来怼天怼地的马库斯都说:不开玩笑,这一次 GPT-5 真的要来了。

从已经泄露的信息来看,GPT-5 肯定更强大。

它将整合 GPT 系列和 o 系列,实现多模态和推理能力大一统、编程能力很强、百万 tokens 上下文、支持 MCP 等。

最快下周就会发布!

据说微软 Copilot 上的 GPT-5 将向所有人开放,不受订阅限制。。

感觉 GPT-5 这一波,是要全面铺开啊。

所以到底有多强?

两款模型都编程能力突出

根据 OpenAI 内部人士透露,GPT-5 实现推理能力(o 系列)和多模态交互能力(4o 以及 GPT 系列)的大一统,以后不用再手动切换模型。

模型包含多个版本:

GPT ‑ 5 主模型(代号 "nectarine" 或 "o3 ‑ alpha")

GPT ‑ 5 mini(代号 "lobster")

GPT ‑ 5 nano(代号 "starfish")

模型的技术亮点可能包括:

输入上下文窗口高达 100 万 tokens,输出可达 10 万 tokens。

支持 MCP(模型上下文协议)与并行工具调用。

动态处理短时与长时推理,集成 Code Interpreter 与其他工具。

性能更快、更可靠、更少幻觉、提升长期对话记忆与逻辑处理能力。

其中 GPT-5(o3-alpha)被曝在高级编程方面表现出色,能达到接近人类程序员水平," 实现更快、更精准的软件开发 "。

它可以自动编写高质量的游戏原型,支持很多应用程序定制以及可以根据特定要求进一步细化。

以及在物理方面也表现出色,一些 zero-shot 的 demo 效果也很不错。

Lobster (mini 版本代号)有消息称它是一个专用的编程模型。在精度和功能方面均优于 Claude 4 等模型,尤其是在一些复杂的编码任务上。

Lobster 可以通过极少的输入快速生成结构完整、功能准确的代码,非常适合处理凌乱的遗留代码,可以自动优化代码结构、清除冗余,同时管理大型软件项目中的依赖关系。

例如一名用户让 Lobster 和另一个模型同时创建交互式神经网络动画,Lobster 一次性就生成了一个带有彩色节点的解决方案,而另一个模型在代码运行中出现错误。

另外 Lobster 据悉也集成了o3 系列模型的高级推理能力,能在简单任务中使用快速响应模式,在复杂任务中触发深层推理模块,更擅长逻辑推理以及解决数学问题。

支持文本、图像、工具调用等多模态,具备类似 Agent 的多步骤组合执行能力,可以让其同时完成解释图像、编写代码和使用工具等任务,而无需像 GPT-4 一次只能处理一类输出。

Lobster 将是编码、推理、多模态理解的融合,将 OpenAI 之前彼此独立的模型集合在一起,让用户直接拥有一个功能更强大的工作助手,轻松执行复杂的多步骤任务。

starfish(nano 版本)则在前几天悄悄出现在了大模型竞技场上。

测试结果显示,这个模型只能做静态的小游戏界面,无法启动游戏。

除了模型本身外,现在微软和 cursor 也被曝将火速接入 GPT-5。

微软正试行新版 Copilot 的  "Smart 模式 "(或称 "magic mode"),能够智能判断何时调用 GPT ‑ 5 的深度推理与多模态能力,以简化用户无需手动选择模型的流程。这项功能显示微软极可能在 GPT ‑ 5 发布后第一时间集成该模型至 Copilot 及 Microsoft 365 生态中,Azure 也在为集成 GPT-5 做准备。

同时也有人发现,cursor 团队正在内部测试 GPT-5 Alpha 版本(图中被模糊掉的部分原来标了 GPT-5-Alpha)。

但大家不容易被奥特曼忽悠了

从各方泄露信息来看,GPT-5 确实如奥特曼所说,强得可怕。

不过,现在大家更冷静、更理智、也更不容易被忽悠了。

有人就说,那又如何?GPT-5 可能在刚刚发布时表现很好,1 周过去它就会开始变笨,像此前所有模型一样。

也有人表示这可能是因为模型发布后,出于安全考量会 ban 一部分能力,所以让大家感觉这是炒作出来的幻象。

" 泼冷水王 " 马库斯也发文表示,即便 GPT-5 真的更强大,但是他还是要给出7 个悲观预测

尽管 GPT-5 在能力上会远超 GPT-4,但 GPT-5 仍然是难以控制的,会继续犯一些难以预料的低级错误,甚至不会完全听从指令操作。

GPT-5 仍然难以处理一些复杂的物理、心理和数学推理任务。

幻觉依旧普遍,且误导性更高,更容易生成看起来正确但实际内容错误的输出。

自然语言输出仍然无法可靠地链接到下游系统(如数据库、虚拟助手等),自然语言指令难以准确映射到用户意图上。

GPT-5 不会是像 AGI 一样的通用人工智能,仍旧需要其它工具协助完成复杂场景任务。

系统仍将无法稳定地遵循有用无害的人类价值观,在输出回答时可能隐含部分偏见。

GPT-5 只是基础的规模扩展,未来 AGI 将朝向更结构化、具备显性知识与规划能力发展,与更广泛的其它技术集成,而这些都是 GPT 系列所缺乏的。

社区里也弥漫着相似的观点,毕竟已经被奥特曼溜了太多次,再不发布,网友们都累了……

天天各种真假混杂的爆料,一些泄露的 GPT-5 基准测试都是 fake news,网友表示,现在除了官方,谁都不可信。

当然也有不少网友认为,这些 " 不经意间的 " 泄漏,都是 OpenAI 在炒作。

总之,不管模型是不是真如宣传所说的这么好,都赶紧发布吧!

参考链接:

[ 1 ] https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/

[ 2 ] https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e

[ 3 ] https://x.com/nicksomed/status/1950507062091485551

[ 4 ] https://www.bgr.com/1926255/gpt-5-leaks-reveal-more-features-ahead-of-launch/?utm_source=chatgpt.com

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

希望了解 AI 产品最新趋势?

量子位智库「AI 100」2025 上半年

「旗舰产品榜」和「创新产品榜」

给出最新参考

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 mini 微软 程序员 准确
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论