早已“破圈”的庞天宇，能带领腾讯混元“破圈”吗？

加入腾讯这件事，庞天宇是在小红书上自宣的。昨天，他在实名账号上发了一则招聘启事，顺带确认了 " 最近加入腾讯混元 "。

庞天宇是清华大学计算机系博士、前新加坡 Sea AI Lab 高级研究科学家，他也成为腾讯在近期继前 OpenAI 研究员姚顺雨之后，招揽到的第二位 95 后顶尖 AI 科学家。

在分工上，庞天宇和姚顺雨并非从属关系。公开报道显示，庞天宇将担任腾讯混元大模型团队首席研究科学家，以及多模态强化学习技术负责人。而姚顺雨此前披露的分工中，除了 "CEO 首席科学家 " 的 title 之外，他还担任 AI Infra 部和大语言模型部负责人。

值得关注的是，腾讯引以为傲的混元 3D 系列，包括世界模型等业务，在去年进行的团队架构大整合中，都归属到了多模态部门旗下。

和相对 " 低调 " 的姚顺雨不同，庞天宇在中文互联网有过 " 破圈 " 的经历。早在 2021 年，他就以清华博士生身份登上综艺《燃烧吧！天才程序员》，成为少数被公众熟知的青年 AI 研究员之一。在知乎等论坛上，庞天宇也一直以实名活跃参与交流。

加入腾讯后，庞天宇第一时间在小红书 " 自宣 "。这种 " 网红 " 风格的操作，其实也是近年来 AI 圈的行业风向：过去一年，社交媒体成了 AI 圈连接器——科研大佬、AI 负责人在上面招聘、分享成果，各家企业都有 " 高 P 大佬 " 实名发帖。

而在腾讯内部，马化腾一边在员工大会上强调 " 稳扎稳打 "，一边亲自为 " 元宝派 "AI 社交新玩法站台，并推出春节 10 亿元现金红包活动抢夺 C 端市场。

这两条线合在一起，就变成了腾讯在 AI 上的的新叙事：产品上用元宝和混元冲锋，组织上招募姚顺雨、庞天宇这样的 95 后顶尖人才，把一批 " 少年英雄 " 推到台前—— 27 岁的腾讯，似乎想在 AI 业务上，换上一些年轻的新面孔来讲故事。

01 上过综艺的 AI 研究员

2021 年冬天，《燃烧吧！天才程序员》综艺开播，镜头里扫过的，是一群 20 岁出头的网络安全和 AI 的研究员。

该节目将选手分为 " 攻防赛道 " 和 "AI 赛道 "。"AI 选手 " 庞天宇时年 25 岁，作为清华大学计算机系博士四年级学生参与了这档综艺。

在同一时期的媒体报道中，庞天宇曾用 " 正常 " 来形容自己。他强调自己 " 不穿格子衬衫 "，日常会打篮球、健身、打游戏、看电影。事实上，这也是这档节目本身的用意之一，借由这些精英年轻技术选手，试图松动大众对程序员群体 " 单一、木讷、社交缺失 " 的固有想象。

出生于 1995 年的庞天宇，高一就获得清华大学保送资格。2022 年清华博士毕业后，他加入新加坡知名研究机构 Sea AI Lab，担任高级研究科学家。Sea 集团在东南亚有着巨大影响力，也是知名电商企业 Shopee 的母公司。

加入 Sea AI Lab 之后，庞天宇迅速成为圈内认可的年轻研究者。据 Google 学术统计，他作为第一作者或共同第一作者，在 ICML、NeurIPS、ICLR 等国际顶级机器学习会议发表过大量论文，并且参与的研究总引用已经超过 1.4 万次。

尽管引用数不能准确衡量一个学者的学术水平，但 1.4 万次已经是年轻 AI 研究者中的顶尖水平。值得一提的是，姚顺雨在 Google 学术的总引用数更为夸张，已经接近 1.6 万次。不过，二人的研究方向完全不同，单看引用次数本身没有太大对比价值。

回到庞天宇的 SeaAILab 研究生涯，他的研究兴趣覆盖了机器学习多个核心方向，尤其是可信机器学习、深度生成模型与鲁棒性（robustness）领域。

所谓鲁棒性，指模型在噪声、分布变化或对抗干扰等非理想条件下，仍能保持稳定表现的能力。它关注的不是模型在 " 标准测试集 " 上的最好成绩，而是在真实复杂环境中是否可靠、是否可控。

在机器学习中，鲁棒性和准确率之间，一直有着不可避免的权衡。庞天宇在 ICML2022（国际机器学习大会）的一篇论文中指出，这种矛盾并非模型能力的本质问题，而是源于鲁棒性定义本身不够合理。

他提出了一个名为 SCORE（自洽鲁棒错误率）的新定义，通过重新调整鲁棒性训练的损失度量，用更符合 " 局部等变性（local equivariance）" 的方式描述鲁棒模型应有的行为。实验结果显示，模型可以在保持高准确性的同时，兼具更稳定的对抗鲁棒性。

从研究方向看，庞天宇长期关注模型在复杂环境下的稳定性与鲁棒性问题。这类工作并不直接追求能力上限，却对多模态系统和智能体在真实产品中的可靠运行至关重要。在腾讯近期不断强化多模态与 Agent 的背景下，引入具备这一研究取向的人才，本身就带有明显的工程和产品导向。

最近两年，庞天宇的研究重点不断延伸，聚焦于大模型与多模态系统在真实部署中的风险问题。2024 年，他参与发表在 ICML2024 的论文中，系统性展示了多模态大模型在 Agent 化之后可能出现的安全放大效应：在实验设置中，单一对抗输入一旦被某个智能体 " 记住 "，就可能在多智能体交互中快速传播，导致整体系统失效。

这项工作首次将 " 大模型越狱 " 从单模型问题，推进到多智能体系统层面，并给出了可复现的实验路径。

从公开成果看，庞天宇的研究覆盖生成、理解与系统层问题，既能参与核心模型工作，也能处理多模态与 Agent 落地时的稳定性与边界问题。这种技术完整度，与腾讯当前混元体系的需求高度契合，也在一定程度上解释了腾讯为何向其伸出橄榄枝。

02 庞天宇来了要干啥？

混元的多模态部门是在去年架构重组后的产物。从腾讯的模型版图看，该部门涵盖生图、视频、3D 生成（单体 / 世界模型）等多个领域。

随着 " 少帅 " 庞天宇空降，我们先盘点一下他面前的腾讯混元多模态家底。

生图部分，混元图像已经更新到 3.0（HunyuanImage3.0-Instruct），并推出图生图版本并开源。与早期更强调 " 生成质量 " 的模型不同，这一版本更突出对复杂指令的理解与执行，把文本理解、视觉理解和图像编辑整合在同一套多模态架构中。

视频生成方面，2025 年，腾讯围绕混元视频系列持续补充了图生视频、定制化生成等能力，并优化推理与部署方案，使其更适合开发者使用。

3D 是腾讯多模态布局中更具长期指向性的方向。目前，腾讯已经正式发布并开源了混元 3D 世界模型，能够从文本或图像生成可漫游的三维场景，并支持导出到真实生产管线中继续编辑和使用。

围绕这一模型，混元 3D 系列在 2025 年持续迭代，同时配套推出面向生产流程的工具产品，强化几何精度、可控性与结果复现能力。

如果把这三条线放在一起看，混元多模态的阶段性成果已经清晰：图片、视频、3D 生成全方位推进的同时，在生态上全面开源，试图在开发者社区层面不断扩大影响力。

从行业视角看，腾讯混元在多模态方向的开源模型活跃度较高，其中混元 3D 系列在 Hugging Face 社区的下载量超过百万次，并在开发者群体中受到关注。相比之下，尽管混元也发布了大语言模型（如 Hunyuan-Large、Hunyuan-A13B 等），但在业内声量上要落后于自家的多模态生态。

另一方面，随着多模态模型的能力逐渐补齐，新的难题才开始显现。当下混元多模态面临的问题，不是 " 能生成什么 "，而是能不能稳定地按用户的意图，把复杂任务完成。

不同形态下，这个问题各有侧重。图生图不仅要改得准，还不能误伤其他区域，风格和结构也要保持一致；视频生成的挑战在于运动是否自然、镜头和主体能否前后一致，以及长序列是否容易失控；而在 3D 场景中，难点则集中在几何精度、结果可控性，以及生产流程能否稳定复现。

去年 8 月，字母 AI 曾专访腾讯混元 3D 负责人郭春超。采访中，他表示，后续的重要优化方向之一，是逐渐降低用户使用门槛，" 比如帮助用户做更多的 prompt 改写，或者提供更多模态的输入，例如‘文 + 图’或‘文 + 多张图’，使其可控性能更契合用户的想法。"

不难看出，提升可靠性一直是混元内部聚焦的方向。而随着近期腾讯释放出更多补强 C 端 AI 业务的信息，持续优化多模态模型的紧迫性进一步提升。

近期举行的腾讯员工大会上，马化腾现身并为元宝站台，腾讯方面一边上线 " 元宝派 " 这种多人社交形态的探索，并配套春节 10 亿元红包玩法，把 AI 助手从单人对话拉向群体场景、拉向更高频的社交分发。元宝中的各种多模态能力也将迎来海量用户的检验。

而相比 B 端场景，C 端场景下模型输出的稳定性要求会显著提高。B 端用户往往不介意花一些时间 " 抽卡 "，但 C 端用户尽管对细节质量要求没那么高，却更考验模型的可靠性，因为他们往往没有足够的耐心去反复尝试。

由此，可以提出一个庞天宇来了要 " 干啥 " 的猜想：为混元补强多模态强化学习与模型行为边界研究的能力，提升多模态场景下模型输出的稳定性、跨模态生成与理解任务的优化等方面。

另一方面，抛开业务层面，作为近期被腾讯招揽的第二位 95 后年轻 AI 学者，庞天宇的加入，显然也释放了组织层面的信号：在 AI 业务上，腾讯开始有意展示一批年轻的面孔。

03 AI 业务要摆脱 " 旧形象 "，新面孔很重要

" 我们团队非常年轻且国际化，团队博士比例大约占 2/3，基本上都来自于海内外名校。" 去年，在专访郭春超的过程中，他曾这样向字母 AI 形容混元 3D 团队人员情况。

在这场对话后不久，混元对外公布了架构大调整，同时先后引入了姚顺雨与庞天宇两个年轻人，分别坐镇语言模型 / 基建层和多模态领域。

这背后，是腾讯在 AI 业务视角下，人才结构策略正在发生的明显变化。过去两年里，腾讯开始更明确地把 AI 人才视为技术竞争的核心力量。

刚刚过去的腾讯年会上，马化腾曾表示：" 每个企业的基因不同、体质不同，腾讯的风格就是稳扎稳打 "，并指出 ChatGPT、DeepSeek 等产品改变了行业进程，但腾讯要坚持以 " 产品长期竞争力和用户体验 " 为核心的路径。

与此同时，他提及腾讯在过去一年加大了对原生 AI 人才的吸引力度，通过年轻化力量重构研发团队。在腾讯走进 27 岁的这一年，马化腾用 " 重构 " 和 " 年轻人才 " 两个关键词，来形容 AI 业务的战略调整。

这一策略在腾讯的青云计划中体现得更具体。该计划面向全球招募 2024 – 2026 年毕业的博士，以及 2025 – 2026 年毕业的本科和硕士生，为青年人才提供师资、算力和极具竞争力的薪酬职级。

马化腾讲话中的 " 重构 "，在某种程度上为腾讯 AI 和混元团队构建了一种梯队式成长叙事，让更多技术青年看到在腾讯内部成长为技术骨干的路径。

另一方面，字节跳动、阿里巴巴等大厂也在用真金白银抢人：字节增长员工薪酬与年终奖金预算，将奖金总池提升约 35%，并提高薪酬调整预算以增强 AI 业务的薪资竞争力；阿里秋招中 AI 岗位占比超过六成，明确把 AI 技术人才作为重点增长方向。

为了对标这些动作，腾讯除了资源投入，也开始树立一批年轻的带头人，如姚顺雨、庞天宇等成为团队的标识。

过去相当长一段时间里，腾讯给外界的整体印象偏向克制与稳健，但 " 稳扎稳打 " 的另一面，是大公司在组织和决策上的惯性。这种气质在 AI 竞赛中并不占优：在 C 端层面，腾讯的元宝既没能压制豆包和 DeepSeek，甚至在部分声量与活跃度上，也被后来者千问反超。

正因如此，从核心团队成员开始调整，对外释放更年轻、更具进攻性的面孔，成为腾讯打破路径依赖、重塑 AI 叙事的一种必要选择。

跑到小红书和知乎连续发招聘启事的庞天宇，正是这种转变最直观的信号——代表未来生产力的 AI 行业，叙事逻辑上要呈现出 " 新瓶装新酒 "。27 岁的腾讯需要一批 " 少年英雄 "，为 3 岁的混元讲好 AI 的故事。

宙世代

一起剪