钛媒体 5小时前
阿里千问变局:天才与巨头的分叉口
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 光锥智能,作者|魏琳华  ,编辑王一粟

3 月 4 日凌晨,林俊旸在 X 上发布 "me stepping down. bye my beloved qwen",那时他是否会想到如此之大的舆论震动,我们不得而知。

但在前一天宣传模型,后一天就宣告离开的情况下,千问大模型(下称 Qwen)裂开了一条缝隙,外部得以嗅到来自阿里内部变化的气息。

一天后,阿里集团 CEO 吴泳铭签发了林俊旸的离职令,并以前所未有的姿态组建了一个由集团最高权力核心构成的 " 三人小组 ",这个三人小组包括吴泳铭、阿里云 CTO 周靖人和现任饿了么董事长兼 CEO 的范禹,共同接管 Qwen 资源调度的问题。

放在今天,Qwen 在中国开源生态的贡献上有目共睹,但带头做出 Qwen2.5、Qwen3 系列模型的两个技术负责人周畅和林俊旸,先后离开了阿里。

在这场离职风暴的中心,隐藏着一个关于 " 实验室理想 " 与 "AI 帝国 " 如何注定分离的命题:

阿里需要的,是一个能够证明阿里 AI 实力的先进模型,为阿里拿下 AI 时代的新入口;一个能在 MaaS 战场上,为阿里云收割付费 Token 消耗的稳定引擎。而林俊旸追求的,是极致的开源精神和垂直整合的组织架构。

两者的故事中,谁都没错,但林俊旸和阿里,已经逐渐来到了分道扬镳的岔路口。

告别 Qwen,周畅和林俊旸先后出走的背后

要理解这场离职风暴的深层逻辑,需要将时间拨回更久以前。

在林俊旸之前,阿里巴巴在大模型领域已经经历了一次核心人才的变化。

第一次,以周畅为首的 AI 团队跳槽,是阿里 Qwen 团队技术骨干出走的一个关键节点。

曾作为阿里 P9 级别员工的周畅,选择加入了字节跳动。据悉,加入字节后,周畅不仅获得字节 4-2 职级,相当于连跳两级,且薪资高达千万级别,比之前翻了好几倍。

周畅的离职,不仅是因为薪资,一部分原因也在于对个人对技术路线的偏好。据晚点 LatePost 报道,彼时的周畅看好多模态方向,但放在 2024 年,也就是大厂集中押注大语言模型的情况下,周畅看中了字节视觉团队抛来的橄榄枝。

人才的流失,显然引起了阿里的警觉。作为接过周畅重任、担任阿里 Qwen 模型团队的技术负责人,从校招 P6 级别进入阿里,到几年内多次升职,林俊旸成为了阿里最年轻的 P10 级别员工。

用马云的话说,离职无非两种原因,一是钱没有给到位,二是 " 心委屈了 "。林俊旸的走,显然属于后一种。

3 月 4 日凌晨,林俊旸在 X 上宣布离职,到第二天阿里批准离职。两天时间内,通过阿里员工发言和媒体报道,基本已经还原出林俊旸的离开,其中难免有和阿里组织的摩擦问题。

最影响到 Qwen 本身发展的,可能是对团队内部资源不足的摩擦。

一个小切口是,林俊旸需要牵头为 Qwen 码来更多资源,难免对 Qwen 团队内部是否为 AI Infra 额外投入、投入多少的想法不同。

林俊旸本人对 Infra 非常看重,这一点,他也在公开场合强调过。

" 今天还有一个激动人心的事情,算法和 Infra 联合优化的事情是真真实实存在的。" 林俊旸在 AGI-Next 峰会上说," 除了像 DeepSeek 提到的提升训练效率、节省资源成本外,我们要完成难度高的任务,都需要 Infra 的相关支持。" 林俊旸说。

虽然阿里有额外的机器学习平台 PAI 负责提供这部分的支撑,但在林俊旸看来,还需要进一步加码,比如在团队中招聘更多相应人才。在林俊旸的社媒平台中,也公开放出过招聘 Infra 相关人才的信息。

林俊旸在社交媒体上招 RL Infra 岗位人员

对 Infra 的看重,不只是林俊旸对阿里的判断。落在今年对 AI 失意的腾讯身上,Infra 也成了 " 天才少年 "、OpenAI 前研究员姚顺雨加盟后的重点之一。

在光锥智能此前的文章《腾讯重构 AI 的 1000 天》中,也曾提及,在腾讯年会上,内部表示,此前模型训练的一些问题原因可能在于基础设施 Infra 的不足。在姚顺雨进入腾讯后,公司单独成立了 AI Infra 部门和 AI Data 部门,区别于之前的部门架构,TEG 中和 AI 训推相关的工作不再和其他业务合并,而是独立为 AI 服务。

但在后期,林俊旸希望自建 Infra 的实现并不顺遂。在晚点播客中,提及林俊旸为了达成相关目标,发生了越过周靖人向阿里集团 CEO 兼阿里云 CEO 吴泳铭寻求 HeadCount(正职名额)的情况。所幸最终,林俊旸如愿以偿。

至于在其它资源上的不足,在 3 月 4 日阿里内部召开的会议中,阿里也承认了这一点。据智能涌现报道,关于招聘问题、内部算力有限问题,周靖人表示,团队处于 " 资源紧张状态 ",内外差异有很多历史原因,未来会进一步规划。

发力顶尖模型,阿里对内动刀

在 " 为什么做 " 的问题上,阿里与林俊旸之间同样存在深刻的裂痕。

作为纯技术人才,林俊旸在 Qwen 开源模型名气的打响上,起到浓墨重彩的一笔。也是在 AGI-Next 峰会上,林俊旸曾经分享过团队为什么会考虑做小尺寸模型,起始是因为团队中有人曾建议开源用于预训练试验的 1.8B 小尺寸模型,会对一些开发者起到帮助。

林俊旸

林俊旸对开源政策的激进,也在公开发言中有所体现。他曾表示,自己希望推进 Qwen3-Max 大模型的开源,但未能如愿。

" 全尺寸、多模态、重开源 " 的策略,帮助阿里在开源社区中建立了无可匹敌的生态优势。以最新发布的 Qwen3.5 为例,除了最先开源的版本,阿里还后续发布了 Qwen3.5 系列的 0.8B、2B、4B 和 9B 四款小尺寸模型,在 X 上获得了马斯克的点赞。

但在阿里的视角中,从追求 AGI 的愿景上,阿里需要的是一个能够领先于 " 六小虎 " 和字节、腾讯的多模态大模型;于阿里云需要靠 MaaS 扩张业务的情况下,集团希望有一个能打的大模型,像 Kimi K2.5、字节豆包模型那样,在 API 上收入进一步扩大。

在 Qwen 核心人员百余人、资源有限的情况下,Qwen 系列的旗舰模型在国内大模型混战中,无法做到在所有系列中都拿到最好成绩。

以最新发布的 Qwen 3.5 旗舰模型为例,作为一个参数 397B 的原生多模态大模型,讲究 " 力大砖飞 " 的情况下,让它和月之暗面万亿参数级别的 Kimi-K2.5 放在一起比分数,似乎有些尴尬。在 Coding 当前更看重模型质量阶段,Qwen3.5 虽然做到了性价比优势,但它不是当前 " 掰腕子 " 的核心。换言之,Qwen3.5 的发力和阿里内部的期许,走偏了。

回顾之前 Qwen2.5、Qwen3 系列大模型,阿里当前在模型生态上的成绩有目共睹,甚至被称为 " 源神 "。但在大模型发展如此迅速的情况下,阿里也依然很着急。

出于对 AI 的焦虑,挖人、组织架构的调整,就变成了顺理成章的思路,这一点在大厂上,基本是必选项。

在谷歌担任 L7 级别、参与 Gemini 研发的周浩,是阿里从硅谷挖回来的人才。据悉,周浩将接手的是 Qwen 团队的后训练负责人一职,这也对应了前后训练负责人郁博文的离开。

人才是第一步,接下来,阿里将到对准内部,开始对组织架构动刀。据悉,这也是引爆林俊旸和阿里冲突的导火索之一。

多家媒体报道,通义实验室近期计划将 Qwen 团队分拆,从涵盖不同训练流程和模态的 " 垂直整合 " 体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队。更进一步的是通义实验室内部之间的合并,比如将 Qwen 负责图像模态的部分并入负责图像生成的通义万相。语音模型部分并入通义百灵。

但在林俊旸之前所在的架构来说,他更坚信 " 垂直整合 " 的思路——将模型训练的全流程,从数据处理、架构设计、预训练、后训练到推理部署,都控制在同一个团队内部,形成高度协同的闭环。

而在这种整合完成、Qwen 模型团队分割成多个水平团队后,留给林俊旸的位置和空间变得有限。在刘大一恒继续担任预训练负责人、周浩担任后训练负责人的情况下,林俊旸原定的位置成迷,且职责范围相比于之前 " 一手抓训练、模型 " 的情况,压缩到分管某个领域的位置。

可以预见的是,在完成组织架构调整后,阿里还需要一位类似姚顺雨、吴永辉之类的技术大牛,来把控这个进一步扩大、拆分的组织架构。

至此,林俊旸和阿里,走到了不得不分手的岔路口。

在 AI 时代,核心顶级人才从来不缺机会,也拥有比普通人更理想的追求;但在时代的巨变前,科技巨头需要把握根据趋势不断调整方向盘,以确保整体的利益最大化。这里没有绝对的对与错。

我们祝愿林俊旸能够在 " 狂飙 " 的 AI 大模型行业中,找到自己的位置;也祝阿里在下定决心修整组织架构后,能够做出心目中的 Qwen-4,在旗舰模型中找到自己理想的生态位。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 离职 ai 阿里云 吴泳铭
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论