GPT-5发布翻车？价格屠夫、编程天才，但AGI不敌Grok 4

8 月 8 日凌晨，GPT-5 千呼万唤始出来。

此时距离 GPT-4 发布，已经过去了两年半时间。

对比 GPT-4 时的震撼，这一次网友们的普遍感受却是：没那么惊艳了。

AGI 水平不敌 Grok 4

能力提升不明显

本次 GPT-5 共发布了 4 个版本，GPT-5 、 GPT-5 mini、 GPT-5 nano，以及只对企业版和每月 200 美元高级版开放的 GPT-5 Pro 模式。

默认模型是 GPT-5，包括用于大多数问题的 " 智能且快速 " 模型（GPT-5-main）以及复杂问题的 " 深度推理 " 模型（GPT-5-thinking）。

在能力和评分上，GPT-5 几乎在每一个上都有提高，但都只比当下 SOTA 高了一点点，也只比 o3 强得很有限。

比如智力水平，GPT-5 虽然高于 o3 水平，但差距并不大。

在号称 AGI 终极测试中，GPT-5 甚至不敌 Grok 4，而且是远远落后。

马斯克都激动得发推庆祝，成为这场发布会最大的赢家。

GPT-5 多模态能力也提升不太显著，依旧不支持音频、视频输入 / 输出和图像生成。

有意思的是，发布会中展示的 PPT，为了突出 GPT-5 的能力，推翻 " 数学规则 "，将 52.8>69.1=30.8。

说真的，GPT-5 赶快把 PPT 能力提升下吧，图表能做成这样！？

GPT-5 的新功能更是表现平平，至少从发布会的演示来看，写作优化、语音功能、记忆能力升级以及自定义聊天界面颜色都不太直观。

价格屠夫和编程天才的结合体

当然，惊喜还是有的。

比如价格。

普通 C 端用户可以免费使用，虽然有次数限制，但基本能做到每天畅聊几小时。

API 用户每百万 token 输入 1.25 美元，输出 10 美元，这个价格比以低价著称的 Gemini 2.5 Pro 都更香。

OpenAI 也忍不住开始搞价格战了？

GPT-5 在编程体验上也做了不少优化，模型在编码时会主动沟通解释它的计划、步骤和发现。

并且能够在构建项目的过程中自动修复 bug，在运行代码检查时，还能够判断哪些问题与当前要修复的 bug 无关，不进行不必要的修改。

很多时候程序员面对的可能是在一堆旧代码上迭代的项目，一堆 bug 但是可以正常运行，牵一发动全身，如果自动修复 bug 可能反而还会增加工作量。

另外，GPT-5 明显降低了幻觉，出现事实错误的概率比 GPT-4o 低约 45%，比 OpenAI o3 低约 80%，仅有不到 1%。

上下文能力也有重要进步，GPT-5 上下文都拓展到了 400k，远超 o3、4o 的 128k 默认版本，准确率比 o3 提升了将近一倍。

总的来说，GPT-5 虽然没有 " 那么 " 惊艳，但小的惊喜不算少。

月赚 10 亿美元

成长为 AI 巨头

在 GPT-4 到 GPT-5 发布的这段时间里，OpenAI 作为一家 AI 公司，正在从独角兽成长为新晋巨头。

据外媒报道，OpenAI 年化收入已达到 120 亿美元（约 862 亿元人民币），月均进账约 10 亿美元（71.8 亿元人民币），对比 GPT-4 时期，增长近 8 倍。

周活跃用户从 1 亿飙升至 7 亿，付费用户已突破 2000 万。

今年，OpenAI 总营收预计能达到 127 亿美元（约 912.2 亿元人民币）。

•END •

欢迎点击科技每日推送视频号，看最新视频 ~

↓↓↓

易简传媒为一家新三板挂牌公司 ( 股票代码 :834498 ) ，旗下新媒体微信粉丝 2500 万 +，讲述各行业的精彩故事，欢迎大家关注以下账号

↓↓↓

宙世代