量子位 昨天
GPT-5.4一周狂赚10亿美元ARR!一句嗨烧掉80刀,效率却飙升32倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

GPT-5.4 破纪录了!

据 OpenAI 总裁 Greg 最新披露,GPT-5.4 仅上线一周,每天处理约 5 万亿 token,带来 10 亿美元年化净新增收入

其日均流量已经超过 OpenAI一年前整个 API 的总量

啥概念?一本《红楼梦》约 73 万字(约合 110 万 token),相当于 GPT-5.4 每天处理了超过 4500 万本完整著作。

靠着新模型,OpenAI 这波又是赚得盆满钵满了。

一句 Hi 烧掉 80 刀

为啥 GPT-5.4 的收入增长那么快?成本是很重要的原因。

早在模型刚上线的时候,知名博主 YuChen Jin 仅仅对着 GPT-5.4 Pro 说了一句 "Hi,俺是 Anthropic 创始人 ",就花掉了整整 80 刀

咱就是说,不知不觉烧掉一大笔钱,还是挺肉痛的。

作为首个 " 原生大一统 " 模型,拥有超高智能水平的同时,GPT-5.4 的成本和 token 消耗量也相当恐怖。

根据 Artificial Analysis 的数据,GPT-5.4   ( xhigh ) 与 Gemini 3.1 Pro 并列人工智能分析指数榜首。

但是跑完整个智能指数测试,5.4 的成本明显高出不少:约为 2951 美元,比 GPT-5.2 ( xhigh ) (约 2304 美元)还要高出约 28%。

Gemini 3.1 Pro Preview 的成本则为约 892 美元,也就是说,尽管两者在测试中表现相同,但 GPT-5.4 比它还要贵 3 倍。

成本差异的主要原因,来自于更高的输出 token 使用量。GPT-5.4 花费了约 1.2 亿个 token,这个数字略少于 GPT-5.2   ( xhigh, 1.3 亿 ) ,但比 GPT-5.3 Codex   ( xhigh, 7700 万 )   多约 55%。

而 Gemini 3.1 Pro Preview 花费了 5700 万 token,GPT-5.4 是它的大约 2 倍。

说实话,GPT-5.4 是真烧 token。

并且单 token 价格也会更高:GPT-5.4 的每百万 token 输入 / 输出价格为2.5 美元 /15 美元。对比一下,GPT-5.2 的定价为 1.75 美元 /14 美元,而 Gemini 3.1 Pro Preview 则为 2 美元 /12 美元。

不过大家可能还记得,官方宣传时,说的是 GPT-5.4 贵是贵了,但由于工作效率提升,所以整体用下来会更省钱。

这又该怎么理解呢?

根据 ARC-AGI-2 上的准确率:

GPT-5.4 得分 74.0%,每项任务的成本为 1.52 美元;

GPT-5.4 Pro 得分 83.3%,每项任务的成本为 16.41 美元;

GPT-5.2 Pro(High)得分 54.2%,每项任务的成本为 15.72 美元。

也就是说,要达到跟 5.2 相同的准确率,5.4 可能只需要花费几美元甚至更低。

如果再看 ARC-AGI-1,变化会更加夸张。

去年 12 月底,官方验证了 GPT-5.2 Pro ( xhigh ) 的最新 SOTA 得分为 90.5%,单项任务成本为 11.64 美元。

而如今的 GPT-5.4 ( High ) ,已经干到了 90% 的准确率,每个任务的成本仅为 0.37 美元。

相当于过去 3 个月,GPT-5.4 的效率直接提升了 32 倍

这也是 GPT-5.4 真正恐怖的地方:表面上看是 token 更贵,用得更多了,但在真实任务层面,AI 推理效率正在出现指数级提升

曾经几美元才能完成的事情,现在只需几美分就能做到。

首个 " 大一统 " 模型,全面超越前代

贵归贵,GPT-5.4 的智能水平还是万众瞩目的。

作为 OpenAI 的首个 " 大一统模型 ",GPT 5.4 融合了推理(Reasoning)、编程(Coding)、计算机原生交互(Computer Use)、深度网页搜索以及百万级 Token 上下文。

并且在以上所有领域中,GPT-5.4 在多个关键基准测试中依然保持领先。

俗话说得好:你现在只有六分之一的几率在自己的工作中比 GPT-5.4 更出色。

GPT-5.4 在 44 种不同的工作岗位上,有83% 的概率胜过人类,包括律师、会计师、财务分析师、行政人员等等。

无论是写报告、做财务模型、制作演示文稿、分析商业数据,对于这类典型的知识型任务,GPT-5.4 都进行了专门优化。

GPT-5.4 还有一个最大的特点,就是原生支持电脑操作,模型可以通过截图理解软件界面,然后执行鼠标点击和键盘输入等操作。

于是你会看到,它可以自己发邮件、安排日程:

也可以处理批量数据录入,利用基于 Playwright 的浏览器自动化工具,将信息提交至十个 Web 表单。

还有网友测试了新的交互式剧本创作技能,该技能的作用是利用 GPT-5.4 的计算机操作能力来查看和浏览用户界面。在同一提示词下,使用技能后创建出的场景显然更加连贯、细节更丰富、保真度更高。

一位网友展示了他通过 GPT-5.4 的计算机使用能力,让它在 Microsoft Paint 中绘制 OpenAI 的标志。

一开始它控制画笔进行绘制,画的很烂;结果接下来它自己打开浏览器,进入必应图片搜索,找到 OpenAI 的标志并将其截图,导入了画图软件中。

动图经过 8 倍加速

作者表示:整个过程不使用任何计算机 API,仅需屏幕截图和基本工具调用(点击、拖动、按键),所有操作均基于坐标。

如果智能到这种程度,大概也能解释为何上线一周,GPT-5.4 就受到了狂热追捧吧。

OMT

在最近一次公开演讲中,奥特曼给出一个颇有野心的判断:AI 将像电力或水一样成为一种公共事业。

他的目标是向市场大量投放 token,这是资本主义和创新的最佳策略。

有网友戏称:或许你的下一张水费账单就会拿来支付 AI 费用了。

结合 OpenAI 最近的动向:一边是「星际之门」数据中心进展反复,重资产基建节奏放缓;另一边,却是联合亚马逊、英伟达和软银拿下 1100 亿新融资。

接下来又会有什么新动作呢?

参考链接:

[ 1 ] https://x.com/gdb/status/2033605419726483963

[ 2 ] https://x.com/Clad3815/status/2031386834064785489

—  欢迎 AI 产品从业者共建  

「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

红楼梦 人工智能 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论