虎嗅APP 08-08
GPT-5发布了,到底有没有那么神?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来自微信公众号:划重点 KeyPoints,作者:常远,编辑:重点君,原文标题:《终于,GPT-5 发布了,也被喷惨了》,题图来自:AI 生成

GPT-5,终于在深夜出炉。

以为很震惊,以为很惊艳?确实有。

但先来看一张图:

OpenAI 到底是如何做到在全球直播的场合展示 Benchmark,竟然能把 52.8 显示得比 69.1 都高,甚至这个 69.1 能跟 30.8 平齐的???

其它的不谈,单就这一点,开场直接号称" 博士水平 "的 AI,就这么水灵灵地 " 按需缩放 " 坐标系,也是引得网友怒喷不已。

甚至 Altman 都赶忙出来转移话题,称技术博客上是正确的……

确实,技术博客确实是有所更正。

但如此失误,着实不应该,毕竟大家都等了 2 年啊!

博士水平的 AI,来了

不过有一说一,除了这个被大众诟病的致命失误之外,GPT-5 在现场的表现还算是可圈可点。

在技术博客中,OpenAI 开场直接一句:" 迄今为止,这是我们最智能、最快速、最实用的模型,内置的思考能力让每个人都能拥有专家级智能。"

这次发布的 GPT-5 拥有四个版本:

GPT-5:在不同领域中进行 Coding 和执行任务的标准模式;

GPT-5 mini:轻量版版本,适用于对明确界定的任务和场景;

GPT-5 nano:强调运行速度和性价比;

GPT-5 Chat:ChatGPT 中使用的版本。

GPT-5 目前已面向普通用户提供免费、plus 和 Pro 三种模式。

同时在 API 平台上,推出了 GPT-5、GPT-5 nano、GPT-5 mini 三种模型选择。

不仅如此,承接昨天时隔 6 年的开源,OpenAI 表示这次GPT-5 面向所有人,免费!并且是博士水平的那种。

我们先来看下 Benchmark。

最让人吸睛的,还是 GPT-5 在AIME 2025的表现,直接拿下满分的成绩。

其次就是编程能力,相较于 o3 和 4o,GPT-5 在思考模式加持之下,达到了 74.9% 的水平。

除此之外,这个模型在多种多模态评测中表现出色,覆盖了图像、视频、空间理解和科学推理等方面。

更强的多模态能力,意味着 ChatGPT 在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容,或者回答关于图示的问题。

而且比较罕见的是,第三方的大模型竞技场(Imarena.ai)也是及时跟进,直接发表声明:" 全方面第一 "

具体而言,竞技场涉及的内容包括:文本、Web 开发、视觉、编程、数学、创造力、长查询等。

由此可见,GPT-5 从目前评测标准来看,确实是 AI 大模型的卫冕之王。

再看效果

成绩是一方面,但实际效果才是硬道理。

深谙此理的 Sam Altman 在自己的 X 账号上也是立马跟进,发布了由 GPT-5 生成的效果:

并且 Altman 还表示,有 GPT-5 权限的用户,只需发送 "use beatbot to make a sick beat to celebrate  gpt-5" 即可体验。

不多不说,营销这块,Altman 还是非常手拿把掐的。

不过在直播的现场演示过程中,GPT-5 还是有不少惊艳的表现在身上的。

例如让 GPT-5 生成一个学语法的 APP,效果是这样的:

不要以为是简单的网站,除了可以完成市面上 AI 的交互之外,它在里面还可以内嵌一个小游戏(点击 "Mouse&Cheese"):

并且若是想改变 APP 里面的内容,只要一句话,瞬间(现场实测)就可以改变布局:

对于更加庞大且复杂的项目,例如现场 OpenAI 展示了用 GPT-5 先编程出来的代码:

在运行之后,便得到了一个 3D 效果的 " 世界 ":

总而言之,从现场效果来看,GPT-5 也是担得起 " 最聪明、最强编程 " 的大模型。

" 观众 " 们买单吗?

从目前 X 上 " 观众 " 的反馈来看,讨论最激烈的就是前面我们提到的图表 bug。

甚至有网友做了一张简单粗暴的 Excel 表格来讽刺这次的失误:

不过另一方面,老东家微软 CEO 火速出面站台,并配有一个 " 爱心 " 图片以表支持:

再如开发者们常用的 VS Code,官方也是 Day 0 无缝衔接 GPT-5:

不过对于普罗大众来说,反馈声音最大的莫过于:" 说好的免费,我的 ChatGPT 咋没有呢?"

总而言之,用户到底买不买单,实测效果到底有没有那么神,需要让子弹再飞一会了。

参考链接:

1、https://openai.com/index/introducing-gpt-5/

2、https://x.com/EgeErdil2/status/1953505551570415718

本文来自微信公众号:划重点 KeyPoints,作者:常远

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

mini nano 编程 数学 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论