谷歌Gemini 3 Deep Think重大升级，聚焦复杂科学与工程推理，成本降低幅度高达280至420倍

谷歌对 Gemini 3 中的 Deep Think 模式进行了重大升级。

谷歌 DeepMind 团队携手多位顶尖科学家和工程师共同推动了这一突破。Deep Think 模式专门针对复杂的科学计算、科研分析和工程问题解决场景设计，强调推理的准确性和深度，而非传统 AI 追求的响应速度。

谷歌官方表示，此次升级是其推理基础设施的 " 重大升级 "，旨在满足研究人员、科学家和工程师处理多步骤复杂逻辑链的需求。

此次升级的时机极具战略意义。当前，OpenAI 凭借其 o1 推理模型在推理能力上持续进步，Anthropic 的 Claude 3 也在科研分析领域表现突出。谷歌的 Deep Think 升级被视为对这两大竞争对手的直接回应，核心在于 " 延伸推理 " ——即赋予 AI 更多时间进行深度思考，从而提升推理质量和准确率。

谷歌强调，这不仅是渐进式更新，而是面向专业领域的突破，尤其适合计算生物学、航空航天工程等对准确性要求极高的行业。

谷歌 DeepMind 团队长期积累了围棋、星际争霸等复杂游戏的推理经验，这为 Deep Think 的专业推理能力奠定了坚实基础。升级后的 Deep Think 在多个国际权威基准测试中表现卓越：在 " 人类的最后考试 " 中取得 48.4% 的新纪录，在 ARC-AGI-2 测试中达到 84.6%，在 Codeforces 竞技编程平台获得 3455 Elo 分，达到世界顶尖程序员水平。

此外，Deep Think 在 2025 年国际数学、物理和化学奥林匹克竞赛中均获得金牌级别成绩，显示其跨学科的深度推理能力。

从成本效益角度看，Gemini 3 Deep Think 在 ARC-AGI-1 测试中的每任务成本仅为 7.17 美元，远低于 OpenAI 高计算版本的 2000 至 3000 美元，成本降低幅度高达 280 至 420 倍，极大提升了科研和工程领域 AI 应用的经济可行性。

谷歌还展示了 Deep Think 在实际科研中的应用案例，如罗格斯大学数学家利用其发现高能物理论文中的逻辑缺陷，杜克大学实验室借助其优化半导体晶体生长工艺，推动科研创新。

此次升级不仅体现了谷歌在 AI 推理领域的技术领先，也反映了企业人工智能应用的转型趋势。

随着企业客户对 AI 推理能力的需求日益增长，模型能否处理复杂财务模型、分析实验数据、发现方法论缺陷，甚至协助专利研究和药物发现，成为评估 AI 价值的新标准。

谷歌凭借其强大的云计算平台和 Workspace 生态系统，将 Deep Think 深度集成，提升了 AI 在企业和学术界的可用性和扩展性。

未来，随着 Gemini 3 Deep Think 的广泛应用，专业领域的 AI 推理能力将持续提升，推动科学研究和工程设计进入智能化新阶段。

谷歌的这一战略布局不仅巩固了其在 AI 领域的领先地位，也预示着人工智能技术正从通用应用向专业深度推理迈进，开启了以准确性和深度分析为核心的新竞争格局。企业和学术界将迎来更高效、更精准的智能辅助工具，推动创新速度和质量的双重提升。（本文首发钛媒体 App , 作者｜AGI-Signal，编辑｜秦聪慧）

宙世代

一起剪

相关标签