阿里千问变局：天才与巨头的分叉口

文 | 光锥智能，作者｜魏琳华，编辑｜王一粟

3 月 4 日凌晨，林俊旸在 X 上发布 "me stepping down. bye my beloved qwen"，那时他是否会想到如此之大的舆论震动，我们不得而知。

但在前一天宣传模型，后一天就宣告离开的情况下，千问大模型（下称 Qwen）裂开了一条缝隙，外部得以嗅到来自阿里内部变化的气息。

一天后，阿里集团 CEO 吴泳铭签发了林俊旸的离职令，并以前所未有的姿态组建了一个由集团最高权力核心构成的 " 三人小组 "，这个三人小组包括吴泳铭、阿里云 CTO 周靖人和现任饿了么董事长兼 CEO 的范禹，共同接管 Qwen 资源调度的问题。

放在今天，Qwen 在中国开源生态的贡献上有目共睹，但带头做出 Qwen2.5、Qwen3 系列模型的两个技术负责人周畅和林俊旸，先后离开了阿里。

在这场离职风暴的中心，隐藏着一个关于 " 实验室理想 " 与 "AI 帝国 " 如何注定分离的命题：

阿里需要的，是一个能够证明阿里 AI 实力的先进模型，为阿里拿下 AI 时代的新入口；一个能在 MaaS 战场上，为阿里云收割付费 Token 消耗的稳定引擎。而林俊旸追求的，是极致的开源精神和垂直整合的组织架构。

两者的故事中，谁都没错，但林俊旸和阿里，已经逐渐来到了分道扬镳的岔路口。

告别 Qwen，周畅和林俊旸先后出走的背后

要理解这场离职风暴的深层逻辑，需要将时间拨回更久以前。

在林俊旸之前，阿里巴巴在大模型领域已经经历了一次核心人才的变化。

第一次，以周畅为首的 AI 团队跳槽，是阿里 Qwen 团队技术骨干出走的一个关键节点。

曾作为阿里 P9 级别员工的周畅，选择加入了字节跳动。据悉，加入字节后，周畅不仅获得字节 4-2 职级，相当于连跳两级，且薪资高达千万级别，比之前翻了好几倍。

周畅的离职，不仅是因为薪资，一部分原因也在于对个人对技术路线的偏好。据晚点 LatePost 报道，彼时的周畅看好多模态方向，但放在 2024 年，也就是大厂集中押注大语言模型的情况下，周畅看中了字节视觉团队抛来的橄榄枝。

人才的流失，显然引起了阿里的警觉。作为接过周畅重任、担任阿里 Qwen 模型团队的技术负责人，从校招 P6 级别进入阿里，到几年内多次升职，林俊旸成为了阿里最年轻的 P10 级别员工。

用马云的话说，离职无非两种原因，一是钱没有给到位，二是 " 心委屈了 "。林俊旸的走，显然属于后一种。

3 月 4 日凌晨，林俊旸在 X 上宣布离职，到第二天阿里批准离职。两天时间内，通过阿里员工发言和媒体报道，基本已经还原出林俊旸的离开，其中难免有和阿里组织的摩擦问题。

最影响到 Qwen 本身发展的，可能是对团队内部资源不足的摩擦。

一个小切口是，林俊旸需要牵头为 Qwen 码来更多资源，难免对 Qwen 团队内部是否为 AI Infra 额外投入、投入多少的想法不同。

林俊旸本人对 Infra 非常看重，这一点，他也在公开场合强调过。

" 今天还有一个激动人心的事情，算法和 Infra 联合优化的事情是真真实实存在的。" 林俊旸在 AGI-Next 峰会上说，" 除了像 DeepSeek 提到的提升训练效率、节省资源成本外，我们要完成难度高的任务，都需要 Infra 的相关支持。" 林俊旸说。

虽然阿里有额外的机器学习平台 PAI 负责提供这部分的支撑，但在林俊旸看来，还需要进一步加码，比如在团队中招聘更多相应人才。在林俊旸的社媒平台中，也公开放出过招聘 Infra 相关人才的信息。

林俊旸在社交媒体上招 RL Infra 岗位人员

对 Infra 的看重，不只是林俊旸对阿里的判断。落在今年对 AI 失意的腾讯身上，Infra 也成了 " 天才少年 "、OpenAI 前研究员姚顺雨加盟后的重点之一。

在光锥智能此前的文章《腾讯重构 AI 的 1000 天》中，也曾提及，在腾讯年会上，内部表示，此前模型训练的一些问题原因可能在于基础设施 Infra 的不足。在姚顺雨进入腾讯后，公司单独成立了 AI Infra 部门和 AI Data 部门，区别于之前的部门架构，TEG 中和 AI 训推相关的工作不再和其他业务合并，而是独立为 AI 服务。

但在后期，林俊旸希望自建 Infra 的实现并不顺遂。在晚点播客中，提及林俊旸为了达成相关目标，发生了越过周靖人向阿里集团 CEO 兼阿里云 CEO 吴泳铭寻求 HeadCount（正职名额）的情况。所幸最终，林俊旸如愿以偿。

至于在其它资源上的不足，在 3 月 4 日阿里内部召开的会议中，阿里也承认了这一点。据智能涌现报道，关于招聘问题、内部算力有限问题，周靖人表示，团队处于 " 资源紧张状态 "，内外差异有很多历史原因，未来会进一步规划。

发力顶尖模型，阿里对内动刀

在 " 为什么做 " 的问题上，阿里与林俊旸之间同样存在深刻的裂痕。

作为纯技术人才，林俊旸在 Qwen 开源模型名气的打响上，起到浓墨重彩的一笔。也是在 AGI-Next 峰会上，林俊旸曾经分享过团队为什么会考虑做小尺寸模型，起始是因为团队中有人曾建议开源用于预训练试验的 1.8B 小尺寸模型，会对一些开发者起到帮助。

林俊旸

林俊旸对开源政策的激进，也在公开发言中有所体现。他曾表示，自己希望推进 Qwen3-Max 大模型的开源，但未能如愿。

" 全尺寸、多模态、重开源 " 的策略，帮助阿里在开源社区中建立了无可匹敌的生态优势。以最新发布的 Qwen3.5 为例，除了最先开源的版本，阿里还后续发布了 Qwen3.5 系列的 0.8B、2B、4B 和 9B 四款小尺寸模型，在 X 上获得了马斯克的点赞。

但在阿里的视角中，从追求 AGI 的愿景上，阿里需要的是一个能够领先于 " 六小虎 " 和字节、腾讯的多模态大模型；于阿里云需要靠 MaaS 扩张业务的情况下，集团希望有一个能打的大模型，像 Kimi K2.5、字节豆包模型那样，在 API 上收入进一步扩大。

在 Qwen 核心人员百余人、资源有限的情况下，Qwen 系列的旗舰模型在国内大模型混战中，无法做到在所有系列中都拿到最好成绩。

以最新发布的 Qwen 3.5 旗舰模型为例，作为一个参数 397B 的原生多模态大模型，讲究 " 力大砖飞 " 的情况下，让它和月之暗面万亿参数级别的 Kimi-K2.5 放在一起比分数，似乎有些尴尬。在 Coding 当前更看重模型质量阶段，Qwen3.5 虽然做到了性价比优势，但它不是当前 " 掰腕子 " 的核心。换言之，Qwen3.5 的发力和阿里内部的期许，走偏了。

回顾之前 Qwen2.5、Qwen3 系列大模型，阿里当前在模型生态上的成绩有目共睹，甚至被称为 " 源神 "。但在大模型发展如此迅速的情况下，阿里也依然很着急。

出于对 AI 的焦虑，挖人、组织架构的调整，就变成了顺理成章的思路，这一点在大厂上，基本是必选项。

在谷歌担任 L7 级别、参与 Gemini 研发的周浩，是阿里从硅谷挖回来的人才。据悉，周浩将接手的是 Qwen 团队的后训练负责人一职，这也对应了前后训练负责人郁博文的离开。

人才是第一步，接下来，阿里将到对准内部，开始对组织架构动刀。据悉，这也是引爆林俊旸和阿里冲突的导火索之一。

多家媒体报道，通义实验室近期计划将 Qwen 团队分拆，从涵盖不同训练流程和模态的 " 垂直整合 " 体系，变成预训练、后训练、文本、多模态等一个个分开的水平分工团队。更进一步的是通义实验室内部之间的合并，比如将 Qwen 负责图像模态的部分并入负责图像生成的通义万相。语音模型部分并入通义百灵。

但在林俊旸之前所在的架构来说，他更坚信 " 垂直整合 " 的思路——将模型训练的全流程，从数据处理、架构设计、预训练、后训练到推理部署，都控制在同一个团队内部，形成高度协同的闭环。

而在这种整合完成、Qwen 模型团队分割成多个水平团队后，留给林俊旸的位置和空间变得有限。在刘大一恒继续担任预训练负责人、周浩担任后训练负责人的情况下，林俊旸原定的位置成迷，且职责范围相比于之前 " 一手抓训练、模型 " 的情况，压缩到分管某个领域的位置。

可以预见的是，在完成组织架构调整后，阿里还需要一位类似姚顺雨、吴永辉之类的技术大牛，来把控这个进一步扩大、拆分的组织架构。

至此，林俊旸和阿里，走到了不得不分手的岔路口。

在 AI 时代，核心顶级人才从来不缺机会，也拥有比普通人更理想的追求；但在时代的巨变前，科技巨头需要把握根据趋势不断调整方向盘，以确保整体的利益最大化。这里没有绝对的对与错。

我们祝愿林俊旸能够在 " 狂飙 " 的 AI 大模型行业中，找到自己的位置；也祝阿里在下定决心修整组织架构后，能够做出心目中的 Qwen-4，在旗舰模型中找到自己理想的生态位。

宙世代

一起剪

相关标签