新智元 6小时前
Gemini 3两小时淘汰ChatGPT,硅谷大佬倒戈:我回不去了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

谷歌 Gemini 3 发布,引发了马斯克、奥特曼、Karpathy 等硅谷 AI 大佬罕见的「集体站队」。Salesforce 的 CEO Marc Benioff 在 Gemini 3 上仅花了两小时后便迅速转粉,直呼不想再回到 ChatGPT。

「我觉得有些人需要好好补补觉了」。

刚刚,谷歌 CEO 劈柴(Sundar Pichai)在一期播客中说道。

Gemini 3 发布后,他希望他和团队能够稍微休息一下。

谷歌 CEO Sundar Pichai

Gemini 3 的发布,被普遍视为谷歌在劈柴带领下,在 AI 赛道强势回归的一个重要信号。

两年前的谷歌,曾一度被认为在 AI 战场中「失去了方向」。

ChatGPT 爆红,微软联合 OpenAI 剑指传统搜索业务核心,谷歌内部拉响「Code Red(红色警报)」,这是一项高级别的紧急应对机制。

谷歌第一次站在了追赶者的位置。

2023 年 Bard 发布会上的「翻车」,让谷歌母公司 Alphabet 市值蒸发约 1000 亿美元。

AI 落后的质疑,一直伴随着这家科技巨头企业。

一直到 Gemini 3 发布,大家才猛然发现,在 AI 赛场,谷歌已经王者归来。

两年前,谷歌在 AI 上迷失方向。如今,它再次引领方向。

Gemini 3 发布不久,AI 圈也掀起了一股「换机潮」,有点「iPhone 时刻」的味道。

最有代表性的,是 Salesforce 的 CEO 马克 · 贝尼奥夫(Marc Benioff)。

他在 X 平台上表示:用了 Gemini 3 之后,感觉世界都变了,进步太疯狂,已经不想再用回 ChatGPT 了:

「我用了两小时 Gemini 3,我不回去了。进步太疯狂了——推理、速度、图像、视频 …… 一切更敏锐、更快。感觉世界又一次改变了。」

作为硅谷科技大佬,Benioff 一直是 AI 的积极拥护者。

ChatGPT 一出来,他几乎每天都在使用,至今已近三年。

但这三年「朝夕相伴」,竟抵不过 Gemini 3 上手两小时。

「AI 新王」的保鲜期可能只有 1 天

不止是 Benioff,包括奥特曼、马斯克在内的诸多科技圈大佬都对 Gemini 3 的表现赞誉有加。

OpenAI 创始团队成员、前特斯拉 AI 总监 Andrej Karpathy 也在 X 平台上表示,亲测过后,他对 Gemini 3 的早期印象非常好。

Karpathy 认为 Gemini 3 在个性、写作、整体氛围、代码风格等方面都非常扎实,具备「成为日常主力工具」的潜力,「属于顶级大模型行列」。

他建议网友「多和模型聊聊」,而不是仅看公开基准测试数据。

因为这些测试数据很容易被模型团队「刻意优化」,这早已成为行业惯例。

Stripe CEO Patrick Collison 使用 Gemini 3 生成了一个互动网页,他的评价是「相当酷」。

Benioff 的此番站队之所以引人注目,还有一个重要因素是他创立的 Salesforce 与 OpenAI、Anthropic 等多家模型厂商都有着深度合作。

他的「转向」具有很强的风向标意义,也说明了用户偏好的变化速度,一点也不亚于大模型的迭代速度。

大模型排行榜上,AI 新王的保质期可能只有一天。

今天的新王,明天很可能就会被「屠榜」。

用户取舍之间,在乎的不是品牌「忠诚度」,而是模型性能和使用体验。

从 GPT-3 到 Gemini 3 的三年进化

Gemini 3 发布后,赢得了许多人的喜爱。

宾夕法尼亚大学教授 Ethan Mollick 也一直在测试它,并为它的表现所震撼。

Mollick 是大模型进化的见证者之一。

大约 3 年前,ChatGPT 刚上线时,他曾发帖表示生成式 AI 在过去 1 个月内以指数级的速度变得更强了。

「今天 GPT-3 又发布了一个新的文本模型,AI 现在能写押韵诗、藏头诗、五行打油诗,还能解释一个糖果驱动的超光速(FTL)引擎是怎样帮助我逃离水獭的。」

三年后,他想回顾一下从 GPT-3 到 Gemini 3,大模型主要取得了哪些进步。

但他并没有把这个任务交给自己,而是把上面的帖子截图直接丢给了 Gemini 3,并给它一个简单提示词:

用实际行动,展示一下自这篇文章发布以来 AI 已经走了多远。

Gemini 回答道:

「当然可以。你分享的这条推文来自 2022 年 11 月——正好处于现代 AI 热潮的开端。当时,AI 能写出一段连贯的文字,或者一首关于『糖果驱动的超光速引擎逃离水獭』这类荒诞概念的简单诗歌,就已经足够令人惊叹了。」

Gemini 并没有满足仅用文字来回答,还「现身说法」做出了一个小游戏:玩家要用糖果的力量逃离水獭,过程中还有不断弹出的有趣更新。

搭建出游戏之后,Gemini 总结到:

「在 2022 年,AI 只能用文字描述这个引擎。到了 2025 年,AI 能写出引擎代码、设计界面,还能让你亲自开这艘船。」

这说明 Gemini 3 已经不再只是一个「聊天机器人」,它还能「动手」做很多新事情。

以这次和 Gemini 3 一起发布的 Antigravity 为例,它有点类似 Claude Code 和 OpenAI Codex 的 AI 编程工具,可以被授予访问用户电脑的权限,并在用户的指导下自主编写程序。

对于用户来说,这不仅是一个编程能力,而是能够让你指挥 AI 使用电脑去做事,比如搭数据面板、操作网站、做 PowerPoint、读你的文件等等。

这样一来,「会写代码的智能体」变成了真正的通用工具。

简单来说,就是人们使用自然语言与 AI 沟通,然后 AI 再通过代码与电脑沟通,使用它们干活。

这个过程中恰恰改变了 AI 作为工具的本质,有点像英伟达 CEO 黄仁勋的一个观点:

「AI 不再是工具,而是能力」。

不仅是协作能力,Gemini 3 的推理能力,同样令 Mollick 惊讶。

Mollick 给 Gemini 3 布置了一个二年级博士生的作业,让它利用一些数据去做一个小型原创研究,并写出一篇论文。

Mollick 并没告诉 Gemini 3 具体该研究什么,它既要找出一个有意思的问题,又要在现有数据的约束下把这个问题做出来,这对于博士生来说也是一个较难的挑战。

结果,AI 就为他产出了一篇 14 页的论文。

在这个过程中,它会自己设定新目标,自己写代码、自己跑实验、自己检查结果。

Mollick 表示,从某种程度上 Gemini 3 已经具备了「博士级的智力」,当然也需要人类更多的指导。

他认为 Gemini 3 是一个非常称职的「思考 + 执行搭档」,同时也释放出很多信号:

AI 进步并没有出现明显的放缓迹象,具有更强自主性的「智能体模型」正在崛起,我们需要想出更好的办法去管理这些越来越聪明的 AI。

从 3 年前只会写诗的「聊天机器人」,到现在能和你一起做原创研究,成为你的「数字同事」,Mollick 认为这可能是 ChatGPT 发布以来出现的最大变化。

巴菲特押注,谷歌强势回归

贝尼奥夫等科技大佬对 Gemini 3 的力挺,标志着谷歌正在强势回归,重新夺回在 AI 领域的领先地位。

Gemini 3 推出三天后,劈柴晒出了一张工程制图风格的「汉堡堆叠规范图」,借 2017 年安卓「汉堡表情翻车」旧梗,宣告谷歌在生成式 AI 上的全面回归:

2017 年,谷歌曾因一个汉堡表情符号的错误设计而遭到了网友调侃。

网友 Thomas Baekdal 在推文中表示谷歌的汉堡表情符号把奶酪放在了牛肉的下面(正确的位置应该在上面)。

如今的 AI 工具早已不是八年前的样子,随着 Gemini 3 和 Nano Banana Pro 的发布,这些 AI 工具对三维空间以及物理世界的理解有了显著提升,已经可以完美还原芝士汉堡的层次感。

Gemini 3 的优异表现也赢得了资本市场的普遍认可。

受 Gemini 3 发布后的影响,谷歌母公司 Alphabet 股价在 11 月 24 日首破 315.9 美元,市值 3.82 万亿美元,距 4 万亿俱乐部仅一步之遥。

而在 11 月 14 日,沃伦 · 巴菲特的伯克希尔 · 哈撒韦披露截至第三季度末持有价值约 43 亿美元的 Alphabet 股份。

如今,Gemini 已被深度整合进搜索业务,谷歌也凭借 Vertex AI、TPU 芯片集群完成逆袭,成为唯一同时拥有模型、算力、分发、芯片以及强大现金储备的科技巨头。

这些共同撑起了谷歌母公司 Alphabet 接近 4 万亿美元市值。

谷歌的 AGI 之路

Google DeepMind CTO、谷歌新任首席 AI 架构师 Koray Kavukcuoglu 坚信 AI 进步的步伐并未放缓,Scaling 仍在持续。

Google DeepMind CTO、谷歌新任首席 AI 架构师 Koray Kavukcuoglu

相比一年半前单纯的研发,作为新任首席 AI 架构师,Koray 的职责扩展到了确保谷歌的产品能真正利用这些模型。

而且 Gemini 3 在发布首日,就覆盖了所有产品界面。

作为技术和产品的桥梁,Koray 认为自己最重要的工作是以最佳方式提供模型和技术,然后与产品团队合作,让他们在这个 AI 世界中构建最好的产品。

他对于谷歌通往 AGI 的看法也很接地气:

感知用户需求、获取用户信号,以此迭代产品,这就是谷歌构建智能,通往 AGI 的路径。

Koray 认为,Gemini 面临的最大风险,是「创新枯竭」——即误以为只要照搬成功公式进行扩展即可。

在他看来,通往 AGI 道路上的动力源泉永远是创新,为此 Gemini 项目内部在持续地寻求新架构、新想法、新的做事方式。

Gemini 的研发起点,基于谷歌深厚的 AI 研究底蕴。Koray 谈到,谷歌拥有大量杰出的研究人员和辉煌的 AI 研究历史:

「谷歌技术团队的大多数成员,包括我自己,在四五年前还在写论文,做 AI 研究。而现在我们站在技术的最前沿,通过与产品用户的互动来开发技术。这是一种完全不同的思维模式。」

Koray 认为,这种研究与产品融合的模式大大提升了产品迭代速度,「现在我们每六个月构建一次大模型,每一到一个半月就进行一次更新。」

随着 Veo 3、Nano Banana 等模型的出现,谷歌在产品化方面也取得了巨大成功。

在这些产品背后,Koray 也谈到了图像模型的回归。

谷歌则一直强调输入输出层面的多模态,并通过 Nano Banana 实现了文本生成模型与图像生成模型的融合。

Koray 预测未来图像生成与文本生成等多模态最终将统一于「单一大模型」之下,这种结合也将产生令人兴奋的化学反应。

Koray 还强调了谷歌的另一项优势:拥有全栈方法。

谷歌从模型、数据中心、芯片到网络,以及如何大规模运行这些系统,每一层都有专家,而且不同层之间在研发上也是可以相互协同。

在科研、技术、产品方面的深厚积累,是 Gemini 3 圈粉科技大佬的重要原因,也是谷歌能够强势回归的重要底气。

如今,AI 格局已经重塑,谷歌可以稍事休息,OpenAI 需要再加把劲了。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 ai 奥特曼 马斯克 科技巨头
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论