
谷歌对 Gemini 3 中的 Deep Think 模式进行了重大升级。
谷歌 DeepMind 团队携手多位顶尖科学家和工程师共同推动了这一突破。Deep Think 模式专门针对复杂的科学计算、科研分析和工程问题解决场景设计,强调推理的准确性和深度,而非传统 AI 追求的响应速度。
谷歌官方表示,此次升级是其推理基础设施的 " 重大升级 ",旨在满足研究人员、科学家和工程师处理多步骤复杂逻辑链的需求。
此次升级的时机极具战略意义。当前,OpenAI 凭借其 o1 推理模型在推理能力上持续进步,Anthropic 的 Claude 3 也在科研分析领域表现突出。谷歌的 Deep Think 升级被视为对这两大竞争对手的直接回应,核心在于 " 延伸推理 " ——即赋予 AI 更多时间进行深度思考,从而提升推理质量和准确率。
谷歌强调,这不仅是渐进式更新,而是面向专业领域的突破,尤其适合计算生物学、航空航天工程等对准确性要求极高的行业。
谷歌 DeepMind 团队长期积累了围棋、星际争霸等复杂游戏的推理经验,这为 Deep Think 的专业推理能力奠定了坚实基础。升级后的 Deep Think 在多个国际权威基准测试中表现卓越:在 " 人类的最后考试 " 中取得 48.4% 的新纪录,在 ARC-AGI-2 测试中达到 84.6%,在 Codeforces 竞技编程平台获得 3455 Elo 分,达到世界顶尖程序员水平。
此外,Deep Think 在 2025 年国际数学、物理和化学奥林匹克竞赛中均获得金牌级别成绩,显示其跨学科的深度推理能力。
从成本效益角度看,Gemini 3 Deep Think 在 ARC-AGI-1 测试中的每任务成本仅为 7.17 美元,远低于 OpenAI 高计算版本的 2000 至 3000 美元,成本降低幅度高达 280 至 420 倍,极大提升了科研和工程领域 AI 应用的经济可行性。
谷歌还展示了 Deep Think 在实际科研中的应用案例,如罗格斯大学数学家利用其发现高能物理论文中的逻辑缺陷,杜克大学实验室借助其优化半导体晶体生长工艺,推动科研创新。
此次升级不仅体现了谷歌在 AI 推理领域的技术领先,也反映了企业人工智能应用的转型趋势。
随着企业客户对 AI 推理能力的需求日益增长,模型能否处理复杂财务模型、分析实验数据、发现方法论缺陷,甚至协助专利研究和药物发现,成为评估 AI 价值的新标准。
谷歌凭借其强大的云计算平台和 Workspace 生态系统,将 Deep Think 深度集成,提升了 AI 在企业和学术界的可用性和扩展性。
未来,随着 Gemini 3 Deep Think 的广泛应用,专业领域的 AI 推理能力将持续提升,推动科学研究和工程设计进入智能化新阶段。
谷歌的这一战略布局不仅巩固了其在 AI 领域的领先地位,也预示着人工智能技术正从通用应用向专业深度推理迈进,开启了以准确性和深度分析为核心的新竞争格局。企业和学术界将迎来更高效、更精准的智能辅助工具,推动创新速度和质量的双重提升。(本文首发钛媒体 App , 作者|AGI-Signal,编辑|秦聪慧)


登录后才可以发布评论哦
打开小程序可以发布评论哦