科技狐 昨天
GPT-5来了!马斯克:我不服!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

人工智能巨头 OpenAI 最近终于推出了万众期待的新一代旗舰模型 GPT-5。

在发布会上,CEO 山姆 · 奥特曼用一个颇具戏剧性的比喻来形容它的跃升:"GPT-3 像高中生,偶尔有灵光却缺乏稳定;GPT-4 像大学生,兼具智能与实用;而 GPT-5,则像是与一位博士级专家对话。"

他还自嘲 " 在 GPT-5 面前一无是处 ",吊足了全球用户的胃口。这场等待了两年半的升级," 千呼万唤始出来 "。

说起来,GPT-5 的诞生并不容易。背后经历了长达一年的艰难研发,核心团队还被高薪挖角,算力开销大得惊人。

OpenAI 这一路真是走得既焦虑又艰辛。现在,终于把这个 " 统一系统 " 搬上了台面,大家都在等它能带来什么新花样。

概括来说,GPT5 最大的变化就是从一个 " 聊天机器人 " 进化成了一个真正能干活的 " 全能助理 "。

首先,多模态开挂让这个新助理的 " 脑子 " 变好使了。过去你跟它说话、发图都得分开来,现在是 " 听说读写看 " 一把抓,你丢给它什么它都能立刻理解。

更关键的是,它学会了 " 动手 "。以前的 GPT 只能给你出主意,现在的 GPT-5 能直接连接你的其他软件,帮你操作 Office、在开发工具里写代码,甚至处理工作流程。

为了让这个助理不那么呆板,OpenAI 还给它预设了不同的 " 人格 ",你可以随时把它切换成毒舌的、严谨的或者善解人意的模式。

自从 DeepSeek 开创了 "Think 模式 " 之后,让大模型在回答前先 " 想一想 " 似乎成了行业标配,各家都推出了类似的功能。

但 GPT-5 有点不一样,它把这个过程变得更直接了。

你不需要去特意寻找或点击某个按钮,只要在提问时加上一句 " 认真思考 ",系统就会自动为你切换到那个更擅长深度分析的 gpt-5-thinking 模式,用更强的 " 脑力 " 来解决你的问题。

接着就是 GPT 传统保留节目:屠榜。OpenAI 甩出了 25 个榜单,密密麻麻的图表告诉你 GPT-5 在各个维度有多牛。

事实性幻觉大幅减少,比 GPT-4o 少了 44%,比 o3 少了 78%,基本上是不胡说八道了。

数学竞赛直接干到了满分,现实世界编程能力新高,人类知识测试新高,多模态能力新高……反正就是新高,新高,全是新高。

发布会一结束,全球的网红和博主们就第一时间冲了进去,开始对 GPT-5 进行五花八门的 " 极限施压 " 测试。

其中,50 万 粉丝的油管主 Matthew Berman 搞了个大的,他用一个 25 分钟的视频,密集展示了 GPT-5 近 30 个堪称变态的任务。

比如,让 GPT-5 写了个程序,能瞬间生成、打乱甚至复原一个复杂的 20 阶魔方。

更狠的是,它直接在网页里复刻出了 Word 和 Excel 的完整应用。注意,是能用的那个软件,而不是给你画个表格那么简单。

从经典的 " 生命游戏 "3D 版,到可以随便调节重力、空气阻力的流体动力学模拟器,GPT-5 还真如奥特曼之前比喻的 " 博士生水平 "。

然而,就在开发者们为之狂欢时,另一边的画风却完全不同。

资本市场最先用脚投票,发布当天概念股普遍回调,显然没被这个 " 博士生 " 彻底打动。

毕竟,大家等了两年半,期待的是一场石破天惊的革命,结果只等到了一次意料之中的常规升级,失望在所难免。

更何况,如今的 AI 竞赛早已进入了残酷的 " 春秋战国 " 时代,各路诸侯的技术差距正在飞速缩小,OpenAI 再想靠常规操作就甩开对手几个身位,已经难上加难。

在这片喧嚣中,OpenAI 的老冤家马斯克更是第一个站出来唱反调,直接甩出成绩单,表示 GPT-5 还不如他家的 Grok 4。

不仅资本和对手不买账,普通网友的吐槽声也越来越大。

大家最直观的感受是,GPT-5 的 " 智商 " 好像是高了,但 " 情商 " 却下降了。

很多人反映,现在用它写文案、写话术,感觉文字变得生硬、机械,没了以前那种灵动和自然。

有网友一针见血地调侃:" 情绪和逻辑就像跷跷板,你把逻辑这头死死按住,情感那头可不就弹飞了吗?"

难怪不少网友担心自己最顺手的 GPT-4.5 会就此消失,不过很快就有热心网友发现,设置里其实有个开关,过去的模型还是可以切换回来的。

这种感觉,让很多人觉得 AI 似乎真的进入了瓶颈期。

而争议最大的,还是官方每次都吹得最响的编程能力。

很多人第一反应还是:" 感觉不如 Claude 好用啊?" 这种 " 奥特曼式营销 " 宣传时天花乱坠,实际用起来却有落差,让不少人对榜单上的 " 新高 " 打了好几个问号。

不过也有网友反馈开发一个粤语学习应用,让几家大模型都试了试,结果 Claude 和 Gemini 在生成 UI 和精准修改代码时都或多或少出了问题,只有 GPT-5 稳稳地完成了任务,效果还出奇地好。

说到底,GPT-5 给人的感觉,就像一个严重偏科的天才:它的文科一塌糊涂,写不出有温度的文字;但它的理科,尤其是在需要严密逻辑和复杂工程能力的领域,还是十分抗打。

老狐觉得网友的这句话就概括得恰如其分:只是没有预期那么好……但仍旧是当前最能打的大模型。

参考资料:

数字生命卡兹克、量子位、财联社、新智能

编辑:不吃麦芽糖

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

奥特曼 人工智能 数学竞赛 聊天机器人 脑力
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论