全天候科技 1小时前
谷歌的阳谋:在GPT-5.2发布日,推出史上“最深度”研究型Agent
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在全球 AI 叙事走向 "Agent 时代 " 的关键节点,谷歌选择了一个颇具戏剧性的发布时机。

周四,就在 OpenAI 端出备受期待的 GPT-5.2(内部代号 Garlic)之日,谷歌同步推出了迄今最强的深度研究型 Agent ——GeminiDeep Research的 " 重制版 ",并宣称其基于旗下最先进的 Gemini 3 Pro 模型。同日,DeepMind 还宣布将在英国建立首个自动化研究实验室,利用 AI 与机器人加速材料科学实验。

这不是 " 撞车 ",更像一场精心策划的阳谋:在竞争对手聚焦全球目光时,谷歌以一款更具战略意味的产品回应——将 Agent 推向操作系统级能力。

从 " 写报告 " 到 " 嵌入应用 ":谷歌试图定义 Agent 的基础设施级入口

全新 GeminiDeep Research 已不是传统意义上的 " 自动写研究报告 " 的工具,它被定位为:

可处理更大规模的上下文、能消化 " 信息山脉 " 的深度研究 Agent

可被开发者直接嵌入 App 的 "AI 研究内核 "

能持续执行数分钟甚至数小时、多步骤推理任务的长链式推理 Agent

这些能力普遍指向一个趋势:谷歌正试图把 Deep Research 变成未来 AI 时代的 " 搜索引擎底层能力 "。

为了让开发者把 Deep Research 更轻松地嵌入自己的应用,谷歌推出了全新的 Interactions API。这等于是把 " 搜索 + 多步骤推理 + 评估 " 打包成操作系统级服务。

谷歌同时宣布,Deep Research 将陆续进入谷歌搜索、谷歌财经、Gemini 应用,以及 NotebookLM。

换句话说:未来不是用户 " 谷歌一下 ",而是你的 Agent 替你谷歌一切

为什么是 Deep Research?谷歌想解决 AI 走向 Agent 后的最大痛点:幻觉率。

谷歌称 Deep Research 受益于 Gemini 3 Pro 的 " 更高事实性 ",能降低在长链推理任务中累积幻觉所导致的结果失真。这类任务可能持续数十分钟甚至数小时,风险显著。

谷歌造新基准:DeepSearchQA、BrowserComp、Humanity ’ s Last Exam

为验证性能,谷歌发布新的 DeepSearchQA 基准,用于测试多步骤信息检索,并开源该基准。

在谷歌自有基准和 " 人类最后考试 " 基准测试中,新 Agent 击败了竞争对手,但 OpenAI 的 ChatGPT 5 Pro 表现接近,并在 BrowserComp 测试中略胜谷歌。

然而,这些基准比较在谷歌发布的那一刻就几乎过时了。因为同一天,OpenAI 发布了备受期待的 GPT-5.2,号称智能体编码最强,赶超人类专家。OpenAI 声称该模型在一系列典型基准测试中击败了竞争对手,特别是谷歌。

从结果看,这一天成为谷歌与 OpenAI 同台竞争的 " 正面交锋 "。

谷歌选择在 GPT-5.2 发布日同步公布 Deep Research,很难不被视为一种主动竞争姿态——既是回应 OpenAI 的新模型,也是试图在 Agent 化快速发展之际,提前占据开发者入口。

在 AI Agent 即将成为新一代 " 搜索框 " 的情况下,谷歌与 OpenAI 的争夺已经从模型战争转向谁能成为未来信息访问方式的基础设施

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 ai 机器人 考试 撞车
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论