新皮层NewNewThing 03-06
林俊旸曾经历通义内部赛马,这种赛马还会继续
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

3 月 5 日,阿里巴巴 CEO 吴泳铭发布内部邮件称「公司已决定批准林俊旸同学的辞职」。

3 月 4 日凌晨,阿里 Qwen(通义千问)团队技术负责人林俊旸在社交媒体 X 上宣布:「me stepping down. bye my beloved qwen.」(我辞职了,再见,我亲爱的 Qwen)。同一天,Qwen 后训练负责人郁博文也宣布离职,而 Qwen Code 负责人惠彬原已在 1 月加入 Meta。

第一财经「新皮层」从一位接近通义的人士处获悉,林俊旸辞职前曾在通义内部与许主洪赛马,2026 年年初加入的周浩是下一个潜在的赛马对象。

许主洪 2025 年 2 月加入阿里巴巴,担任阿里智能信息事业群首席科学家,向吴嘉汇报,主要工作内容是负责 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案。2025 年 9 月,许主洪转岗至通义实验室,从事多模态交互模型方向的研究。

加入阿里巴巴前,许主洪曾是新加坡管理大学终身教授,主要研究「多模态预训练」,还曾创办 AI 初创公司 HyperGAI,开发多模态大模型。

上述人士称,许主洪转岗至通义实验室后,共同向阿里通义实验室负责人、阿里云 CTO 周靖人汇报,两人之间的赛马由此开始。不过许主洪在这场赛马中的产出并不理想,而林俊旸带领的 Qwen 团队在 2026 年春节期间交出了 Qwen3.5 系列模型。

2026 年年初,阿里巴巴通义实验室继续引入了 Google DeepMind 前高级资深研究科学家周浩加入。一位 Qwen 团队离职员工告诉「新皮层」,周浩入职后同样直接向周靖人汇报。前述接近通义的人士称,周浩的空降与许主洪的转岗逻辑一致,都是通过增设平级负责人强化内部竞争。

林俊旸本科毕业于国际关系学院英语系,硕士就读北京大学语言学专业,2019 年加入阿里巴巴,是阿里早期 MoE 大模型 M6 的核心成员。2024 年千问模型原技术负责人周畅离职后,林俊旸接管团队,推进了 Qwen3 和 Qwen3.5 系列模型的训练与发布。

3 月 5 日的内部邮件中,吴泳铭称阿里巴巴会「继续坚持开源模型策略」,同时也会继续「加大吸纳优秀人才的力度」。

在大模型领域,阿里目前还没有站在一个安全位置,提升人才密度是必然选择。

单从下载量和衍生模型数量上看,Qwen 系列模型是目前全球累积下载量和衍生模型数量最多的开源模型。开源社区 Hugging Face 1 月 21 日的统计数据显示,Qwen 自 2023 年 4 月首次开源以来,模型全球累积下载次数已突破 10 亿次,衍生模型数量突破 20 万个。相较而言,DeepSeek 的全球累积下载数量只有 5000 多万,衍生模型数量也只有 2000 多个。

OpenClaw 模型调用量排名。数据来源:OpenRouter

不过在以模型调用量统计的维度上,Qwen 并不在全球前列。全球最大的语言模型 API 聚合平台 OpenRouter 的数据显示,2 月 16 日至 22 日的周榜单中,平台调用量排名前 5 的模型中有 4 家来自中国,分别是 MiniMax 的 M2.5、月之暗面的 Kimi K2.5、智谱的 GLM-5 和 DeepSeek 的 V3.2。Qwen 相关模型并不在其列。

而在全球风靡的 AI 智能体 OpenClaw 的模型调用量中,K2.5 也至今保持榜首位置,成为最受欢迎模型。由于这种推动,Kimi 在发布 K2.5 模型后不到一个月的累计收入,已超过其 2025 年全年收入总和。被 OpenClaw 带火的前 10 大模型中,中国模型还包括 MiniMax 的 M2.5、阶跃星辰的 Step 3.5 Flash 和 DeepSeek 的 V3.2,Qwen 也没有模型在其中——包括其 2 月 16 日最新推出的最新模型 Qwen3.5。

阿里要面对的模型挑战并不少。

原生多模态之战

原生多模态是 Google 2023 年提出来的概念,它当年 12 月发布的 Gemini 1.0 被官方定义为「原生多模态」,区别于 GPT-4 那样的「拼装多模态」。意思是 Gemini 是一个将文本、图像、音频和视频等多模态数据同时用于预训练的原生多模态架构,而之前包括 GPT-4 在内的所谓多模态模型都是拼装式的:其主体仍然是个语言模型,只是当用户需要多模态能力时,它会再调用额外的多模态模块——图片理解或生成模型、视频理解或生成模型——来提供服务。

2025 年 11 月,Google 凭借 Gemini3 在多项基准测试的多项指标上超越 GPT-5,迫使 OpenAI 在 2025 年 12 月启动「红色警报」,暂停广告等非核心项目,以应对 Gemini3 的冲击。

Gemini 的成功印证了原生多模态架构的可行性和潜力。

2026 年中国春节期间,月之暗面、字节跳动和阿里巴巴也先后发布了各自的原生多模态模型—— K2.5、Seed2.0 和 Qwen3.5。但截至目前,只有 K2.5 被 OpenClaw 带火了,Qwen3.5 和 Seed2.0 几乎都没有从这个现象级传播和实际调用中受益。

不过字节跳动同期发布的另一款视频生成模型 Seedance2.0 在影视创作领域掀起了风暴,被外媒评价为「令好莱坞陷入恐慌」的中国 AI 模型。而 Qwen3.5 没有获得明确的市场标签。

周浩,今年年初加入通义实验室。

林俊旸宣布离职后,Qwen 的后训练负责人郁博文也宣布了离职,他的工作将由今年年初入职阿里的周浩负责。根据领英资料,周浩曾是 Google DeepMind 高级资深研究员,作为核心参与了 Gemini3.0、AI Mode 与深度研究等关键项目的研发。

字节跳动在 2025 年年初引入的大模型一号位吴永辉也来自 Google DeepMind,曾作为 DeepMind 研究副总裁深度参与 Gemini1.0 和 Gemini1.5 的研发,Gemini1.0 开启了 Google 的原生多模态和长上下文时代。字节跳动 2026 年春节期间发布的 Seed2.0 原生多模态模型与视频生成模型 Seedance2.0,均是其加入后的最大成果。

现在,阿里也挖来了 Google DeepMind 背景的人。3 月 4 日的通义全员会及 3 月 5 日的内部信中,阿里管理层连续两次明确对全员表态:需要吸纳更多外部人才。

随着更多人被引入通义实验室,类似林俊旸和许主洪那样的赛马肯定还将继续。

要学 Google 吗?

Qwen3.5 的发布和周浩的引入都意味着阿里可能也开始在模型策略上向 Google 学习,但在更大的涉及产品和模型关系的产模策略上,没有迹象表明它会学习 Google。

Google 在 2024 年 10 月将原本独立运行的 Gemini 应用团队并入 Google DeepMind,以解决长期以来研究成果与市场需求脱节的问题。到了 2025 年 4 月,连负责从 0 到 1 做 AI 产品孵化的 Google Labs —— NotebookLM 就是这个团队的成果——也被并入了 Google DeepMind,实现了从模型到应用的垂直整合,由 Google DeepMind CEO 哈萨比斯(Demis Hassabis)统一管理。

阿里的动作刚好相反。早期,阿里云完全主导了通义模型和通义应用(现「千问」App)的开发。但 2024 年 12 月,阿里将通义应用团队从阿里云拆分出来,并入了夸克所在的智能信息事业群,这个事业群 2025 年 12 月与智能互联事业群(天猫精灵等 AI 硬件团队)合并为千问 C 端事业群,由吴嘉负责管理。

多家媒体报道称,林俊旸相信模型层的垂直整合,他认为预训练、后训练,乃至 Infra 团队,应该更紧密地结合和沟通。然而,为 Qwen 做 Infra 工程的团队隶属于阿里云,与 Qwen 模型训练团队存在沟通挑战。

前述 Qwen 离职员工告诉「新皮层」,林俊旸期待 Qwen 团队自主承接更多 Infra 的工作。2025 年 12 月,林俊旸还曾在小红书的个人账号上亲自发了多篇 Infra 相关的招聘帖。

Qwen 只是通义实验室旗下 3 个模型团队之一。

不过,传闻阿里管理层可能的架构调整方向是将包括通义千问(Qwen 模型所在团队)在内的 3 个模型团队(通义千问、通义万相和通义百聆)分拆,然后按照预训练、后训练、文本、多模态等职能来划分部门。在此之前,3 个模型团队有各自的预训练和后训练模块,能够在一个小团队内闭环地完成模型训练。这种调整通常意味着一个行业已经迈过从 0 到 1 阶段、技术路径开始收拢、不再需要更多闭环小团队才能完成的实验性项目。这个判断目前还不是业内共识。不过这项调整如果推行,包括林俊旸在内的 3 位模型技术负责人原来的职位将不再存在。

在产模层面,截至目前,没有信息表明包括 Qwen 在内的通义系列模型和千问 App 等应用团队相互独立的架构短期内会发生变化。

通义应用团队与夸克、天猫精灵等面向 C 端的业务合并后,已经更名成为「千问」,今年 1 月 15 日打通了淘宝、淘宝闪购、支付宝、飞猪、高德等阿里生态,让用户可以在千问内直接点外卖。后来还发布了千问眼镜。3 月 2 日,阿里还进一步将此前发布的夸克眼镜直接更名为千问眼镜。

即使将模型和应用团队重新合并,阿里目前也缺乏一位像哈萨比斯那样的资深领导者。主管通义实验室的周靖人更多只是一位技术领袖,整个阿里云至今没有一位可以统领技术和业务的 CEO,这一职位目前仍然由阿里巴巴集团 CEO 吴泳铭兼任。

此外,千问应用团队也尚未出现像 NotebookLM 背后推手 Josh Woodward 那样的角色,能够紧跟模型迭代、通过产品最大程度放大自身模型性能和特长,从而建立产品与模型的正向循环。

开源战略与云增长的冲突

最后,阿里仍然面临开源战略与云业务增长存在潜在冲突的挑战。

就在林俊旸宣布离职的前一天,他还在 X 上回应马斯克对 Qwen3.5 小尺寸模型的点赞。而 Qwen3.5 正是他离职前最后一次公开产品发布。在林俊旸的离职帖下,全球 AI 开发者、开源社区的建设者们纷纷留言,感谢他与 Qwen 团队为开源大模型生态做出的贡献。

阿里 2023 年 8 月开始就在模型层实行开源战略,这种开源并不只针对 Qwen(通义千问)系列模型,视觉模型通义万相和语音模型通义百聆同样走开源路线。

一位接近阿里云的人士对「新皮层」称,阿里对大模型的终极判断是,模型本身不足以构成技术护城河,最后将变成基础设施。因此,模型的商业价值更可能通过云服务变现,核心还是卖算力,而开源更有助于建立这种商业模式需要的全球影响力。

3 月 5 日的内部信中,吴泳铭称,阿里「将继续坚持开源模型策略」,间接否认阿里大模型要转向闭源的传闻。

但阿里管理层预期的从开源到云增长的正循环并没有变成现实。相反,AI 云市场最大的市场份额被字节跳动旗下的火山引擎夺走。

根据 IDC 数据,2024 年中国公有云大模型对外调用量(Tokens)达 114.2 万亿,其中火山引擎以 46.4% 的份额位居第一,阿里云与百度智能云都位列第二(19.3%)。到了 2025 年上半年,阿里云的占比虽提升至 27%,但火山引擎依然以 49.2% 的市场份额继续保持第一。通义庞大的开源模型生态并未转化为阿里云在大模型云服务市场的主导权。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里巴巴 阿里 开源 吴泳铭 离职
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论