谷歌对OpenAI见招拆招

出品｜虎嗅科技组

作者｜余杨

编辑｜苗正卿

头图｜视觉中国

11 月 19 日消息，谷歌家旗舰版 Gemini 3 Pro model 上线，官宣其编码和推理能力都有所提升，而 " 谄媚 " 变少。

不难发现，谷歌瞄准了它的对手 ChatGPT。这款号称谷歌迄今为止 " 最智能 "、" 最准确 " 的模型首次向所有用户开放，并且发布首日即可体验。

谷歌 DeepMind 高级总监兼产品负责人 Tulsee Doshi 表示，随着谷歌搜索引擎的不断发展，这款新模型将助力谷歌实现 " 人人皆可获取且人人皆可使用 " 的信息目标。

" 我认为朝着这个方向迈出的一大步，就是跳出仅仅提供文字回复的模式，让你看到更丰富、更完整的实际内容。"

对 OpenAI 见招拆招

简单来说，Gemini 3 Pro 具有 " 原生多模态 " 特性，它可以同时处理文本、图像和音频，传统的文本 - 文本的单一交互状态得到了提升，编码功能的增强也使其能够生成更好的视觉效果。在谷歌的官方演示中，AI 对 RNA 进行了加工处理，整体表现得很流畅。

谷歌官方表示，Gemini 3 Pro 还可以翻译菜谱照片，然后将其转换成食谱；除此之外，它还可以根据一系列视频讲座创建交互式学习卡片。

在 Gemini 应用中，用户则可以在内置的 Canvas 中构建功能更全面的程序。升级后的 AI 模型支持 " 生成式界面 "，一方面可以创建类似杂志的视觉格式，其中包含可供浏览的图片，另一方面可以根据用户的提示创建定制的自定义用户界面的动态布局。这款工具目前还在测试中。

在搜索功能上，Gemini 3 Pro 可以根据用户的搜索呈现图像、表格、网格和模拟等视觉元素。根据 Google 的公告，这项技术现在不仅能将问题分解成可搜索的部分，还能更好地理解用户的搜索意图，从而 " 找到之前可能遗漏的新内容 "。

谷歌对 OpenAI 见招拆招，几乎毫不掩饰地暗讽，称 Gemini 3 Pro 不像 ChatGPT 那样充斥着空洞的奉承。

Doshi 表示，Gemini 3 Pro 的回复会有 " 显著 " 的变化，谷歌将其描述为 " 智能、简洁、直接，摒弃陈词滥调和奉承，提供真正的洞见——告诉你你需要听到的，而不仅仅是你想听到的 "。

除了这些改进之外，Gemini 3 Pro 还具备更强大的推理和智能代理能力，使其能够完成更复杂的任务，并 " 可靠地进行长期规划 "。谷歌表示，该模型为 Gemini Agent 的一项实验性功能提供支持，该功能可以在 Gemini 应用内帮用户执行任务，例如查看和整理电子邮件，或搜索和预订旅行。

也就是说，谷歌此番发行的不仅仅是模型单品，还是一个充满策略的 " 聪明桶 " ——覆盖了 AIGC、AI 应用、AI 搜索和 AI Agent 全范围。

跑分表达

而在官方的跑分 21 项基准测试中，Gemini 3 Pro 除了 OCR 和代理编码表现相对较弱，其他指标几乎都遥遥领先，有相当的优势。

不仅如此，而谷歌又单独拎出了人类最终测试、终端工作台 2.0 和 SimpleQA Verified 三个指标加以强调，矛头直指 Claude Sonnet4.5 和 GPT-5.1。

谷歌试图表达，Gemini 3 Pro 在标准化知识生成、AI 工具使用乃至 " 人工智能 " 这几个重要指标方面，具有全方位的优势。

Antigravity：" 智能体优先的未来 "

在发布 Gemini 3 Pro 的同时，谷歌还推出了 Antigravity，这是一款基于 Gemini 3 Pro 以及其他第三方模型的开发工具。谷歌表示，Antigravity 支持多个智能体，并允许它们直接访问编辑器、终端和浏览器，其设计理念是面向 " 智能体优先的未来 "。

Antigravity 有两个关键组件。

其中之一在于它如何报告自身的工作。具体来说，在完成任务的过程中，它会生成 Google 称之为 " 工件 " 的文件：任务列表、计划、屏幕截图和浏览器录制，旨在验证它已完成的工作以及即将执行的工作。

不仅如此，Antigravity 还会报告其操作和外部工具的使用情况，但 Google 表示，相比模型操作和工具调用的完整列表，" 工件 " 更便于用户验证。

另一项重大改进是提供了两种主要使用视图。默认的编辑器视图提供熟悉的集成开发环境 ( IDE ) 体验，类似于 Cursor 和 GitHub Copilot 等竞争对手，并在侧边栏中显示代理。而全新的管理器视图则旨在同时控制多个代理，使每个代理都能更加自主地工作。

谷歌将其比作 " 任务控制中心 "，用于 " 并行地在多个工作区中生成、协调和观察多个代理 "。

谷歌推出了更多向人工智能代理提供反馈的方式，用户可以在代理执行特定任务时留下评论，供其参考，而无需中断其工作。谷歌表示，Antigravity 中的代理能够 " 从过去的工作中学习 "，保留特定的代码片段或执行特定任务所需的步骤。

在官方演示中，Antigravity 构建了一个基本的航班跟踪应用程序，对其进行了测试，并通过浏览器录制报告了该测试结果。

目前，Antigravity 已推出公开预览版，兼容 Windows、macOS 和 Linux 系统。

谷歌此次的出击，并不止于发布一个大模型这么简单。智能体开发平台的开放性，展露出谷歌构建从模型、应用到开发者的完整生态闭环的野心。

多模态的交互将 AI 从一位博学的 " 对话者 "，重塑为一个能看、能听、能行动、能规划的 " 执行者 "。当 AI 开始理解和操作多媒体世界，未来 3D 和全景、沉浸式的交互竞赛，也就不远了。

宙世代

一起剪

相关标签