科技每日推送 08-08
GPT-5发布翻车?价格屠夫、编程天才,但AGI不敌Grok 4
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

8 月 8 日凌晨,GPT-5 千呼万唤始出来。

此时距离 GPT-4 发布,已经过去了两年半时间。

对比 GPT-4 时的震撼,这一次网友们的普遍感受却是:没那么惊艳了。

AGI 水平不敌 Grok 4

能力提升不明显

本次 GPT-5 共发布了 4 个版本,GPT-5 、 GPT-5 mini、 GPT-5 nano,以及只对企业版和每月 200 美元高级版开放的 GPT-5 Pro 模式。

默认模型是 GPT-5,包括用于大多数问题的 " 智能且快速 " 模型(GPT-5-main)以及复杂问题的 " 深度推理 " 模型(GPT-5-thinking)。

在能力和评分上,GPT-5 几乎在每一个上都有提高,但都只比当下 SOTA 高了一点点,也只比 o3 强得很有限。

比如智力水平,GPT-5 虽然高于 o3 水平,但差距并不大。

在号称 AGI 终极测试中,GPT-5 甚至不敌 Grok 4,而且是远远落后。

马斯克都激动得发推庆祝,成为这场发布会最大的赢家。

GPT-5 多模态能力也提升不太显著,依旧不支持音频、视频输入 / 输出和图像生成。

有意思的是,发布会中展示的 PPT,为了突出 GPT-5 的能力,推翻 " 数学规则 ",将 52.8>69.1=30.8。

说真的,GPT-5 赶快把 PPT 能力提升下吧,图表能做成这样!?

GPT-5 的新功能更是表现平平,至少从发布会的演示来看,写作优化、语音功能、记忆能力升级以及自定义聊天界面颜色都不太直观。

价格屠夫和编程天才的结合体

当然,惊喜还是有的。

比如价格。

普通 C 端用户可以免费使用,虽然有次数限制,但基本能做到每天畅聊几小时。

API 用户每百万 token 输入 1.25 美元,输出 10 美元,这个价格比以低价著称的 Gemini 2.5 Pro 都更香。

OpenAI 也忍不住开始搞价格战了?

GPT-5 在编程体验上也做了不少优化,模型在编码时会主动沟通解释它的计划、步骤和发现。

并且能够在构建项目的过程中自动修复 bug,在运行代码检查时,还能够判断哪些问题与当前要修复的 bug 无关,不进行不必要的修改。

很多时候程序员面对的可能是在一堆旧代码上迭代的项目,一堆 bug 但是可以正常运行,牵一发动全身,如果自动修复 bug 可能反而还会增加工作量。

另外,GPT-5 明显降低了幻觉,出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80%,仅有不到 1%。

上下文能力也有重要进步,GPT-5 上下文都拓展到了 400k,远超 o3、4o 的 128k 默认版本,准确率比 o3 提升了将近一倍。

总的来说,GPT-5 虽然没有 " 那么 " 惊艳,但小的惊喜不算少。

月赚 10 亿美元

成长为 AI 巨头

在 GPT-4 到 GPT-5 发布的这段时间里,OpenAI 作为一家 AI 公司,正在从独角兽成长为新晋巨头。

据外媒报道,OpenAI 年化收入已达到 120 亿美元(约 862 亿元人民币),月均进账约 10 亿美元(71.8 亿元人民币),对比 GPT-4 时期,增长近 8 倍。

周活跃用户从 1 亿飙升至 7 亿,付费用户已突破 2000 万。

今年,OpenAI 总营收预计能达到 127 亿美元(约 912.2 亿元人民币)。

END •

欢迎点击科技每日推送视频号,看最新视频 ~

易简传媒为一家新三板挂牌公司 ( 股票代码 :834498 ) ,旗下新媒体微信粉丝 2500 万 +,讲述各行业的精彩故事,欢迎大家关注以下账号

↓↓↓

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

马斯克 编程 程序员 界面 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论