文 | 最话 FunTalk,作者 | 林书,编辑 | 刘宇翔
2025 年的最后一个月,一则消息在科技圈引起了不小的震动—— 27 岁的 OpenAI 前研究员姚顺雨正式出任腾讯 "CEO/ 总裁办公室 " 首席 AI 科学家,同时兼任新成立的 AI Infra 部负责人。
这不仅是一位顶尖 AI 人才的回归,更是腾讯 AI 战略的重大转向信号。
作为 OpenAI 前研究员,姚顺雨为智能体方向的发展做出了突出贡献。他提出了 ReAct 方法,并首次引入 " 推理一行动 " 结合的智能体范式,这一思路不但增强了模型的可控性,也极大拓展了其在各类实际领域中的适用能力。
这样的顶尖人才加入,意味着腾讯这次真的想好好做大模型了。
在这个节点上审视腾讯的 AI 布局,会发现一个有趣的时间悖论:身为 BAT 三巨头之一,腾讯直到 2025 年末才真正开始认真布局大模型,这与其他互联网巨头的节奏,形成了鲜明对比。
据 IDC 2025 年 Q3 数据显示,中国大模型市场份额中,百度文心占 31%、阿里通义 24%、字节估算 18%,腾讯混元未跻身前三。百度在 2025 年 11 月的百度世界大会上正式发布文心大模型 5.0,以 2.4 万亿参数规模开创全球首个原生全模态大模型;而字节跳动旗下的豆包大模型更是增速惊人,截至 2025 年 12 月,其日均 token 使用量已突破 50 万亿,位居全球第三、中国第一。
当然,不同统计口径得出的结论并不相同,但不可否认的是,混元大模型的份额,确实与腾讯在互联网的地位是不匹配的。除了要抹平数据上的差距外,还有一件意外的动因,潜在地加速了腾讯的 AI 布局。
腾讯为何现在才认真做大模型?
腾讯礼聘姚顺雨当然并非一朝一夕的事,招揽这一层级的顶尖人才,应该很早就接触,并经过多轮面谈,双方在待遇、级别乃至发展方向都达成了共识才行。
但在姚顺雨入职腾讯前,有一个事件特别值得关注——豆包手机助手的问世。12 月初,字节跳动与中兴合作的豆包手机因 AI 代理功能引发行业地震,这款手机能够跨应用自动操作,实现端到端的服务闭环。更重要的是,它使用了安卓系统中的 INJECT_EVENTS 高危权限,可以模拟用户操作,实现真正的 " 手机自己干活 "。
这一创新对微信构成了潜在挑战。豆包助手可以通过 AI 代理完成跨应用服务,从点外卖到预订酒店,无需用户在多个 App 间跳转。这种端到端的用户体验,对微信这种封闭生态构成了实质性冲击。
面对这样的冲击,腾讯终于坐不住了。12 月 17 日,腾讯宣布升级大模型研发架构,新成立 AI Infra 部、AI Data 部和数据计算平台部,全面强化其大模型的研发体系。
实际上,腾讯过去的 AI 战略有 " 重应用轻基础 " 的嫌疑。长期以来,腾讯 AI 聚焦应用层优化——广告算法、游戏 AI、内容审核等,这些大体上是对应用层的投入,似乎缺乏对大模型作为 " 新操作系统内核 " 的重视,或者说从外界的感知来看,其重视程度是不足的。
腾讯早期的 AI 负责人多是工程或管理背景,以技术工程事业群总裁卢山、副总裁蒋杰为代表的团队,长期以来在广告算法优化和业务落地方面表现出色,但在前沿大模型研究方面,相对缺乏具有深度学术背景的顶尖人才。
此外,大语言模型部副总经理王迪,虽在大模型工程化方面有丰富经验,但同样缺乏在基础研究层面的突破性贡献。
这种战略错位在技术竞争中已经显现。尽管腾讯在 2025 年发布了混元 2.0,采用 406B 参数的混合专家架构,在推理能力上有所提升,但在全球大模型竞技场 LMArena 的排名中,混元模型长期不在第一梯队。直到 2025 年 10 月,混元视觉模型才跻身全球前三、国内第一的位置,这已经是相对较晚的突破了。
在 C 端应用方面,根据 QuestMobile 数据,截至 2025 年 3 月初,腾讯元宝日活用户约为 200-300 万水平,而同期豆包日活已接近 3000 万。截至 2025 年 8 月,腾讯元宝月活用户规模约 275 万,在综合类 AI 原生 APP 中排名第八。
或许一系列的变化,加速了姚顺雨的加入,这也标志着腾讯开始更重视基础研究层面的突破。作为 OpenAI 首批智能体产品 Operator 与 Deep Research 的核心贡献者,他不仅带来技术能力,更重要的是带来了对 AI 发展方向的深刻理解——这正是腾讯过去缺乏的 " 顶层研究领袖 "。
姚顺雨为何可能改变腾讯?
要理解姚顺雨对腾讯的意义,首先需要深入了解他的学术与工程背景。姚顺雨的经历堪称传奇—— 1998 年出生于安徽合肥,2015 年以 704 分的高考成绩考入清华大学计算机系姚班,成为当年安徽省的探花。
2019 年本科毕业后,姚顺雨直接进入普林斯顿大学攻读计算机科学博士学位,师从知名学者 Karthik Narasimhan 教授。在这里,他开始专攻自然语言处理与强化学习,并提出了一个具有里程碑意义的概念—— "Language Agents"。
其博士研究聚焦于解决一个核心问题:如何让 AI 像人一样边思考边行动。他在 2020 年提出的 ReAct(Reasoning+Acting)框架,紧接着在 2022 年提出了思维树(Tree of Thoughts,ToT)方法,这是对大模型推理能力的进一步突破。
在 ReAct 和 ToT 出现之前,大多数 AI(包括早期 Agent)的 " 思考 " 其实是单线程、不能回头、不能试错的。例如:
用户问:" 怎么快速从北京去上海?"
普通 AI 往往会这么操作:
" 第一步:打开 12306;第二步:查高铁票;第三步:买票…… "
这就像一个人闭着眼睛按攻略走路,从不调整方向,走到死胡同就卡住,很多公司说的 "Agent 会思考 ",其实只是把普通思维链包装成多步指令(比如 " 先查天气,再查餐厅 "),但一旦中间出错,就彻底失败。

而 ReAct 和 ToT 的 AI,具备 " 韧性 " 和 " 灵活性 " ——这才是姚顺雨工作的真正价值。
在 ReAct 框架中,AI 不再是 " 闭门思考 " 然后 " 执行行动 ",而是像人类一样,将推理与行动结合在一起,每一步推理都伴随着行动与验证。
同样地,ToT 允许 AI 在解决复杂问题时探索多条推理路径,每条路径都是一个 " 思维分支 ",AI 可以在这些分支间比较、评估和回溯。这不仅提高了 AI 解决复杂问题的能力,更重要的是为 AI 的 " 深度思考 " 提供了机制基础。
根据 Google Scholar 统计,ReAct 和思维树的引用次数已超过 4000 次,姚顺雨的个人总引用次数超过 1.5 万次。更重要的是,这些方法成为了后续 AI Agent 研究的重要基石。
2024 年博士毕业后,姚顺雨加入 OpenAI,成为研究科学家。在那里,他深度参与了智能体产品 Operator 与 Deep Research 的开发。这两个项目是 OpenAI 在 Agent 方面,真正面向实际应用的产品化尝试。
这两个项目,让姚顺雨得以真正践行了能自主探索、验证、规划、协作的 AI 代理——在他来看,这才是下一代 AI 的真正形态。
在 OpenAI 期间,姚顺雨还在 2025 年 4 月发布了一篇重要的博文《AI 的下半场》,提出了他对 AI 发展的深刻见解。他指出:" 上半场的 AI 主要关注解决问题的方法炫技,而下半场的 AI 将专注于定义真正有价值的问题。"
姚顺雨认为,AI 的下半场将是从 " 技术竞赛 " 转向 " 应用落地 " 的关键时期,Agent 如何嵌入人类生活、工作与关系网络将成为核心议题——而这正是腾讯这种身为 " 基础设施 " 的巨头想要的。
找到 " 打败微信的那个东西 "
说到底,腾讯不缺工程能力,也不缺商业化经验,更不缺钱,但却缺乏对 AI 发展中最重要的基座能力——大模型的掌控力。
姚顺雨不仅带来了技术方法论,更重要的是,是带来了对 " 未来大模型该是怎样的 " 这一关键问题的回答。
尽管腾讯作为 " 国民基础设施 " 企业,业务版图已经遍布各个领域——社交、游戏、支付、云计算等,但实际上,腾讯一直缺乏比较强力的大模型能够从最底层将生态中的各个版图彻底打通。
混元模型虽然在 2025 年发布了 2.0 版本,参数规模达到 406B,支持 256K 上下文窗口,但在应用层面,其使用量远低于预期。这反映了腾讯在大模型商业化应用上的滞后。
更关键的是,在姚顺雨看来,微信面临着被 " 很不一样的东西 " 颠覆的风险。2025 年 9 月,在一次深度访谈中,姚顺雨提到:" 真正的危险,不是说一个类似于微信的东西打败了微信,而是一个很不一样的东西打败了微信。"
这个 " 很不一样的东西 ",很可能正是一种具备复杂推理、长期记忆、多目标权衡能力的 AI Agent。
为什么微信是 "Agent 革命 " 的最佳试验场?
因为微信不是单纯的聊天工具,而是中国用户完成 2C、2B 及混合场景的核心平台——从订餐转账到办公社群,从小程序服务到社交互动。
这些场景看似简单,但组合起来构成了极复杂的意图网络。用户发一条消息,可能意味着外卖订餐需求、工作协作请求、社交互动、或者情绪表达。Agent 需要具备跨上下文理解能力、风险与偏好权衡能力、关系动态维护能力。
2025 年第三季度财报电话会上,腾讯总裁刘炽平首次系统披露微信 AI 化战略蓝图,明确表示 " 微信最终会推出一个 AI 智能体 ",让用户在微信生态内即可完成各类事务。
这句话看似轻描描写,实则信息量巨大——它意味着微信将从 " 被动响应消息 " 的工具,进化为主动编织服务与关系的 " 意图操作系统 "。
姚顺雨的目标不是让 AI 帮用户自动点外卖,而是构建一个能够理解用户深层意图,并在微信生态中无缝执行复杂任务的智能系统。这包括:理解对话中的隐含需求,预测用户的长期偏好,协调多维度权衡(价格、速度、服务质量),以及维护社交关系的动态平衡(自动回复但不显得生硬)。
从 " 消息链 " 到 " 意图链 " 的转变,或许正是将来 " 微信新革命 " 的核心。
传统的聊天工具处理的是 " 文本消息 ",而意图操作系统处理的是 " 用户意图 "。前者是被动响应,后者是主动理解。这种转变需要 Agent 具备复杂推理能力——不仅理解 " 用户说什么 ",更要理解 " 用户真正想要什么 ",以及 " 如何以最优方式满足这个需求 "。
结语
站在 2025 年末这个节点回望全年,各类 Agent 所展现出的自动点外卖、比价功能,确实让行业眼前一亮。但客观而言,这些功能目前仍停留在相对初级的 " 杂活 " 层面——它们展示的是 AI 能够跨应用操作的能力,但尚未触及更复杂的认知与决策场景。
随着 Agent 技术的持续演进,用户的需求场景也会越来越复杂,Agent 之间的技术差距才会真正显现。谁能在复杂推理、多目标权衡、长期记忆等方面建立优势,谁才能在下一代 AI 竞争中占据制高点。
姚顺雨这样的顶尖人才加入腾讯,显然不是为了做 " 只会点外卖 " 的 Agent。杀鸡用牛刀,非不能也,乃不为也。
他和团队要寻找的,是那个真正能够 " 颠覆微信 " 的东西——或许,那是一个全新的交互范式,一种重新定义人与服务、人与信息关系的方式。在 AI 进入下半场的关键时刻,这种探索的价值,远比任何单点功能的突破更加深远。
这也是腾讯眼下最紧迫、最想要的东西。


登录后才可以发布评论哦
打开小程序可以发布评论哦