量子位 昨天
谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

不得了。

谷歌 Gemini 3 Pro 进步太大了,与上一代 2.5 Pro 之间差出一个 GPT-5.1(狗头)。

新模型在几乎所有基准测试中超过 GPT-5.1 和 Claude4.5,包括人类最后的考试、ARC-AGI-2 这些专为 AGI 准备的测试,数学的 AIME 2025 带工具拿满分,还刷新了之前让大模型全员得 0 分的 LiveCodeBench Pro 纪录。

用户投票的大模型竞技场也是一样,马斯克的 Grok4.1 昨天才刷完榜,今天就被反超了。

这下奥特曼和马斯克也不得不佩服了,前后脚出来点赞祝贺。

测试期间看 Gemini 3 模拟 Windows、Mac、Linux 三大操作系统界面,还以为它只擅长设计前端呢,原来设计出的程序他真能用啊。

设计一个乐高编辑器,一次尝试就完成了界面 + 负责空间逻辑和所有编辑器功能。

谷歌官方用 Gemini 3 Pro 设计的游戏更是发布在了油管上可以直接玩,纯靠 AI 都能搭起一个 4399 小游戏网了你敢信?

在智能体任务上,Gemini 3 Pro 不光擅长编程,还强化了现实生活任务的长期规划能力,模拟管理自动售货机一年赚了 5000 美元,取得所有模型中最高的收入。

从今天起,谷歌宣布 " 以整个公司的体量 " 发布 Gemini 3 系列模型,包括首次在发布当天就将 Gemini 整合进搜索,上线独立 APP,还推出全新的智能体开发平台。

还有一个更强 Gemini 3 Deep Think 深度思考模式,正在路上。

至于这么大的能力飞跃如何实现的,只有研究 VP Oriol Vinyals 透露了一点:预训练还没结束,后训练也还有很大改进空间。

Gemini 系列的集大成者

回看 Gemini 系列这几年的演进,有点像打怪升级了,每一代都在补上一代的短板,然后在下一代里又把所有能力都打磨一遍。

1 代奠定根基,把多模态能力和超长上下文打通,Gemini 成为第一个能够处理百万级 tokens 上下文的大模型。

2 代就开始变得有行动力,在 1 代的基础上记住大量信息后,它就整合海量信息进行决策和规划,这也为智能体能力铺了路。

到了 Gemini 2.5,谷歌则开始认真搞思考和推理,给它加了思考引擎,让它能做更深入的推理、链式思考,甚至模仿人类分步解决问题。

现在的 3 代更是能力的集大成者,不是简单堆料,而是深度融合,多模态、推理、Agent 能力这些特性一起进化,主打 " 你敢想,我实现 "。

而且,Gemini 3 更明显的变化是更懂人话了。

不用纠结提示词是否写得 " 有水平 ",只要把需求一丢,再长的提示词它也能抓住语境、明白意图,然后回你一句更简洁又直接的答案,没有彩虹屁的那种(doge)。

多模态方面更是开挂,文本、图像、视频、音频和代码一股脑地无缝理解。

比如说,给它看一段球赛的长视频,它就能总结打法,把球员技巧整理出来,然后顺便教你复现动作。

怎么感觉,上传自己的训练视频,就可以直接让 Gemini 3 当教练了……

在搜索场景里,Gemini 3 也不是直接扔给你一堆链接,而是把即时查询的信息组织成你真正能用的东西,生成可交互式的内容。

反重力开发平台,杀入 AI 编程战场

这次与旗舰模型 Gemini 3 Pro 同步推出的,还有 Google Antigravity(反重力)实验性智能体开发平台。

其核心理念是构建一个 " 智能体优先 "(agent-first)的开发环境,将开发者从繁琐的编码工作中解放出来,转向更高层次、面向任务的架构师角色。

官方展示了如何用 1 分钟开发一个航班追踪程序。

与 Cursor 为代表的 AI IDE 相比,Google Antigravity 的智能体已被提升到一个独立的界面,并可直接访问编辑器、终端和浏览器。智能体可以代表用户自主规划和执行复杂的端到端软件任务,同时验证自身的代码。

全新的管理器视图旨在同时控制多个智能体,使每个智能体都能更加自主地工作。

谷歌对这款开发工具的野心很大,他不仅支持 Gemini 系列模型,也允许使用 GPT-OSS、Claude 第三方模型。

Antigravity 目前以公共预览版的形式免费提供,并承诺为 Gemini 3 Pro 的使用提供 " 慷慨的速率限制 ",一发布就吸引了大量开发者来 " 薅羊毛 "。

目前 Claude Code 收入占 Anthropic 总营收约 21%,OpenAI 也在不断围绕 Codex 做文章。

AI 编程工具,看来是下一个必争之地了。

参考链接:

[ 1 ] https://blog.google/products/gemini/gemini-3/-anything

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

聊 AI,当然得来量子位 MEET2026 智能未来大会

张亚勤、孙茂松等首波 AI 行业重磅嘉宾已确认出席,还有更多嘉宾即将揭晓  了解详情

  12 月 10 日

北京金茂万丽酒店

,期待与你共论 AI 行业破局之道  

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 马斯克 奥特曼 界面 考试
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论