Tech星球 1小时前
一场没有退路的豪赌:解码阿里腾讯字节的AI“总攻”路线图
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

|王琳 任雪芸 陈桥辉

封面图源| 豆包 AI

在互联网发展史上,没有跟上技术发展而掉队的公司并不在少数。而今天,当大模型的号角吹响,没人想让类似的故事再次发生,腾讯、字节跳动、阿里巴巴这三家中国互联网历史上收入最高的公司尤甚。

于是,在杭州的西溪园区、深圳的滨海大厦以及北京的大钟寺(三家公司的总部),形成了一种久违的共识——他们正在把最核心的算法人才、最昂贵的算力资源,以近乎 " 不计成本 " 的方式收归旗下。

这是一次史无前例的投入。逻辑的转变在于,过去 AI 只能解决边界清晰的特定领域问题,如自动驾驶,那大模型则是一套通用操作系统——同一套模型,既能写代码,又能写文案,还能解数学题。这意味着 AI 不再是个别产品的 " 插件 ",而是可以嵌入电商、搜索、社交、支付、出行等所有场景的底层引擎。

正因如此,在偃旗息鼓数年后,互联网大厂们的一号位再次集体下场发声,今年战况进一步变得胶着。千问、豆包、元宝在春节又掀起了久违的红包大战,微信和支付宝抢着做 AI Agent 的第一入口,Seedance 和 Happyhorse 在视频生成领域碰头。

这不仅是一场技术的博弈,更是一场关于组织敏捷度、战略定力与耐力的全面战争。

三套班底,两套用人逻辑

AI 战略是互联网大厂久违的一号位工程,毫无疑问,阿里巴巴、字节跳动、腾讯集团挂帅的分别是吴泳铭、梁汝波、马化腾。

阿里习惯组织为战略服务,2023 年,当将 AI 正式确立为集团大战略后,阿里迎来了新任 CEO:吴泳铭。这位拥有技术背景、最年轻的 " 十八罗汉 " 之一,是阿里大模型的绝对一号位。

在吴泳铭的带领下,阿里形成了集顶层、前台、中台、后方的四层架构。集团技术委员会是这套架构的最顶层,于今年 4 月成立,由吴泳铭亲任组长,核心成员为周靖人、吴泽明、李飞飞三人,形成覆盖 AI 全栈的决策体系。

三人在阿里的司龄时间、定位与战绩各有侧重:其中司龄最短的是 2016 年从微软加入阿里、至今在阿里工作 10 年的周靖人,他是阿里大模型技术路线的核心制定者,也是从零搭建了通义千问(Qwen)系列大模型的关键人物之一。

司龄最长的是 2004 年加入淘宝、至今在阿里工作 22 年的吴泽明(花名范禹),他是阿里工程体系与业务落地的核心负责人,作为集团 CTO、技术委员会召集人,同时也是阿里最高决策层 5 人合伙委员会的成员,早年作为 " 双 11" 技术总负责人,后来带领淘宝闪购在即时零售赛道破局,目前主导集团技术中台与 AI 推理平台建设。

2018 年加入阿里、至今在阿里工作 8 年的李飞飞(花名飞刀)是全球顶尖的数据库专家,作为阿里云 CTO,他目前主导 AI 算力基础设施建设,核心负责 AI" 底座 " 也就是云计算、芯片、存储等算力支撑体系。

三人分别覆盖了 AI 最核心的模型能力、落地效率、算力成本三个关键维度,是吴泳铭搭建的 AI 四层架构得以高效运转的核心决策层。

作为中台的 Alibaba Token Hub(ATH)事业群成立于 3 月 16 日,是与阿里电商、云智能、国际业务并列的集团一级事业群,同样由吴泳铭直接负责,是整个 AI 体系的资源整合中枢。

它以 " 创造 Token、输送 Token、应用 Token" 为核心目标,整合了此前分散在各业务线的通义实验室、百炼 MaaS 平台、千问 C 端助手、悟空 B 端工作平台、AI 创新业务等所有 AI 相关资源,统一调度集团的算力、模型、场景资源,让 AI 能力像水电一样在集团内部高效流转。

其中,MaaS 平台由阿里云公共云事业部总裁刘伟光负责,主导关键的输送 Token 环节;千问由阿里集团副总裁吴嘉负责;悟空事业部隶属于钉钉旗下,由陈宇森担任 CEO,产品负责人为束骏亮。刘伟光、吴嘉、陈宇森三人均直接汇报给吴泳铭。

作为 ATH 下属部门,承担前台变现功能的是于 6 月 8 日刚刚成立的 Token Foundry 事业部,它是阿里大模型业务的前台,由通义大模型事业部、未来生活实验室合并组建。

其中,通义大模型事业部的主要成就是 Qwen 大语言模型系列,未来生活实验室此前隶属淘天集团,其明星产品便是视频生成模型 Happy Horse、世界模型 Happy Oyster,负责人为郑波。合并后,郑的主要工作是多模态和产品落地的核心负责人。

不难发现,Token Foundry 更像是阿里基础大模型的主力部队。该事业部是吴泳铭直管的商业化核心部门。它的主要功能是承担 AI 业务的营收目标,打通技术到商业变现的最后一公里。

提供后方支持的是李飞飞担任 CTO 主导的阿里云,提供 AI 所需的芯片、存储、云计算等底层算力基础设施。而阿里云智能集团的最高负责人依旧是吴泳铭。

此外,作为集团技术探索的新大脑,AI 未来研究院成立于 6 月,集团首席科学家周靖人牵头,聚焦 AI 前沿探索,主攻 AGI(通用人工智能)、下一代大模型架构、多模态、世界模型等前沿方向,为 AI 业务的中长期技术路线铺路,并不承担短期商业化 KPI。

不难发现,吴泳铭直接管理了前台、中台和后台,并没有再单独设立负责人,这体现了他 AI 转型的战略意志。而他搭建的这套架构形成了从短期商业落地、中期资源协同到长期技术储备的完整闭环,三者权责清晰、互相支撑,结束了阿里此前 AI 业务分散在各 BU、各自为战的内耗状态。

图注:阿里 AI 组织架构图,制图:Tech 星球。

相比于阿里频繁的组织架构调整,腾讯则显得较为温和,这符合腾讯习惯后发制人的作风。更大的区别是,腾讯并没有在组织设计上成立技术委员会,其 AI 战略的绝对话事人也并未随着战略的变化而发生改变,最高决策层依旧沿袭着最初的 " 双子星 " 架构——由董事会主席马化腾和总裁刘炽平主导,马化腾偏战略,刘炽平偏战略落地。

腾讯 AI 的明星人物便是其首席 AI 科学家姚顺雨。姚在 OpenAI 期间,是首批 Agent 的核心贡献者,主导了 Computer-Using Agent(CUA)和 Deep Research 两个重要产品。他提出的 ReAct 框架已成为全球构建语言智能体的最主流方法。

2026 腾讯云 AI 产业应用大会上,因为姚的首次公开露面,大会现场一度人满为患,足见其在 AI 圈层的影响力。

他是少有的拥有两条汇报线的员工,是腾讯 AI 技术的灵魂,全面领导腾讯大模型及相关 AI 技术的研究、基础设施建设与产品落地。作为首席 AI 科学家,他直接向腾讯总裁刘炽平汇报,这一身份使得他能够直接参与公司最高层的 AI 战略决策。

同时,作为掌管 AI Infra 部与大语言模型部的负责人,他也向技术工程事业群(TEG)总裁卢山汇报。这确保了 AI 基础设施建设等具体技术工作能与公司的技术平台高效协同。

另一个关键人物是高级执行副总裁、云与智慧产业事业群(CSIG)CEO 汤道生。汤是腾讯老人,在腾讯工作 20 余年,他的主要职责是主导 AI 产品与落地,旗下产品包括腾讯元宝、QQ 浏览器、腾讯会议等。目前,腾讯桌面级办公助手 WorkBuddy 便来自该事业群。

微信之父张小龙被认为是腾讯 AI 最不容忽视的力量,即将上线的微信 Agent" 小微 " 被认腾讯在 AI 棋局中的胜负手。

图注:腾讯 AI 组织架构图,制图:Tech 星球。

阿里和腾讯都选用了早期创始成员来做绝对 1 号位,而非职业经理人。他们都有技术背景,有过突出战绩,拥有绝对的话语权,在内部有足够的威信,能调动更多的资源,字节跳动某种程度上也延续了这种风格。

字节跳动大模型的 1 号位梁汝波,也是创业元老,更大的特殊性在于他和字节创始人张一鸣是大学校友,在创办字节前就共同创业过 " 九九房 "。这种长达二十年、从校园到职场的并肩作战,让梁汝波可以获得张一鸣的足够信任。此外,已经卸任字节跳动董事长的张一鸣也会深度参与顶层决策。

字节跳动大模型的技术灵魂是吴永辉。加入字节前,吴一直在谷歌工作,期间其主导了具有里程碑意义的谷歌神经机器翻译系统(GNMT,出任 Google DeepMind 研究副总裁,拥有谷歌最高技术荣誉—— Google Fellow(职级 L10),也是 Gemini 大模型的核心贡献者之一。

吴永辉 2025 年 2 月加盟字节跳动,是 Seed 团队的一号位,字节大模型基础研究总负责人,直接向 CEO 梁汝波单线汇报。

他核心统筹 Seed 全部基础模型研发,覆盖通用大语言底座、多模态底层、AI 算力基础设施与长期 AGI 前沿探索,同时全权主导字节 Top Seed 全球顶尖 AI 人才招募计划,Seedance 视频生成、豆包基座等核心底层技术路线均由其制定。

字节 AI 产品应用的 " 关键先生 " 即朱文佳,他加入字节已经 10 余年,先后任职今日头条负责人、TikTok 产品技术负责人,被行业人士认为是字节内部最擅长打通技术与商业落地的管理者。朱文佳早期牵头组建了字节大模型团队,现在主要分管 Seed 应用侧,火爆全网的豆包出自他手,他直接向吴永辉汇报。

字节大模型 To B 业务的关键人物是火山引擎总裁谭待,统筹豆包、Seedance 对外企业服务与产业落地。谭 2020 年加入字节,此前最重要的职业经历是在百度,在技术领域尤为突出,多次获百度最高奖。

除此之外,字节 AI 业务还有多位不可忽视的年轻技术人才。Seed 多模态负责人周畅统管图文、视频生成技术团队,支撑 Seedance 视频大模型赛道,还有像年轻骨干曾妍为 Seedance 系列核心研发负责人,代表字节 AIGC 细分赛道人才储备。

图注:字节 AI 组织架构图(部分),制图:Tech 星球。

在组织架构上,腾讯和字节跳动并没有那样明显的四层架构,前者更强调融入,将 AI 能力深度整合进现有的、强大的业务事业群中,尤以 TEG(技术工程事业群)与 CSIG(云与智慧产业事业群)为两大支柱,组织上并不另起炉灶。后者拥有 Seed 这样的独立团队,直属于最高决策层,以创业姿态在 AI 战场上冲锋陷阵。值得一提的是,阿里四层架构所具备的功能,字节和腾讯也都已经具备。

在人才配置上,这三家公司除了 1 号位的配置高度相似,在技术人才上,情况全然不同。

阿里更倾向于内部培养人,重用元老,阿里 AI 的 " 旗帜 " 周靖人在阿里工作已经 10 年,Qwen 团队的核心成员多由内部培养,如早期核心成员刘大一恒。这种人才策略某种程度上和阿里在 2017 年就开始前瞻性布局达摩院有关。

腾讯和字节跳动有相似之处,他们都倾向于高薪挖人,一些关键位置也愿意给新人。两家的技术核心姚顺雨和吴永辉就都是挖来的。98 年出生的姚顺雨也是三家技术领军人物中最年轻的,和其他两位都相差近 20 岁。

字节跳动挖人集中在 2024 年,推出了 Top Seed 计划。已卸任 CEO 的张一鸣亲自参与 AI 战略制定,并监督从竞争对手处招聘 AI 工程师和研究员的工作,人才储备的深度和广度也是字节在大模型领域后来居上的关键转折点。

但现在,基础模型上略显落后的腾讯显得最为主动,除去从 Open AI 挖来姚顺雨外,还从字节挖来包括肖学锋、黄启等在内的多位人才。据不完全统计,过去一年,字节核心的 Seed 团队有近 70 名技术人才离职,其中约 30 人流向了腾讯。

人才流失是字节跳动最需要面对的问题。除去被竞争对手挖掘,字节系创业者也成为了大模型领域的抢手货。

一个共识,三种打法

对于致力于成为 AI 时代基础设施的大厂来说,他们习惯三路并行:底层是基础设施,包含芯片、数据中心、云计算平台等;中层是模型与平台层,如通用大模型和开发平台 MaaS;最上层是产品与应用。这也是顶级大厂做 AI 的终极战略形态。

按照这个逻辑来看,阿里的布局最为全面。

阿里平头哥半导体自研芯片含光 800(AI 推理)、倚天 710(服务器)及新一代真武 M890(训推一体)等多款产品,部分已规模化量产。

在开源模型层,通义千问(Qwen)已经成为全球市场份额最高的开源大模型系列:截至 2026 年 3 月,Qwen 系列占据全球开源模型下载量的 50% 以上,累计下载量接近 10 亿次。

而在 4 月发布的 Qwen3.6-Plus 上线仅 3 天,就在全球最大 AI 模型聚合平台 OpenRouter 创下日调用量 1.4 万亿 Token 的全球纪录,成为首个单日处理 Token 破万亿的大模型。最新迭代的 Qwen3.7-Max 进一步主打长周期 Agent 自主执行、全栈编程、办公自动化三大核心能力。

对应的开发平台层,阿里云百炼 MaaS 平台是国内规模最大的模型服务平台之一。

这些构成了阿里 AI 商业化的核心基石,Qwen 的技术优势直接转化为了阿里云的收入增长:2026 财年 Q4 财报显示,阿里云 AI 相关产品单季收入达 89.71 亿元,在外部商业化收入中的占比首次突破 30%,连续 11 个季度实现三位数同比增长。

在 C 端,千问 APP 是阿里 AI 战略最重要的用户入口,也是国内首个跑通 "AI+ 交易履约 " 闭环的 AI 产品。和纯对话类 AI 工具不同,千问深度打通了淘宝、饿了么、飞猪、高德、支付宝等阿里全系生态,用户数据上,2026 年春节千问通过 30 亿免单活动快速起量,日活最高突破 7352 万。

但 AI 购物解决可能的是一个并不存在的痛点,因为购物和点餐的决策过程本身,对许多人来说就是一种乐趣和社交体验。同时,在实际体验中,千问也出现技术稳定性、精准度等问题。

目前来看,阿里并无明显短板,但唯独缺一个能打的 C 端产品。这也是阿里和字节最大的区别之一。

字节的豆包是大模型行业用户量最多的 C 端产品,QuestMobile 数据显示,2026 年一季度,豆包日活用户约 1.4 亿,月活用户约 3.45 亿,超过第二名与第三名的月活总和。虽然,豆包背后的大语言模型可能表现并不优异,上下文长度也有待加强,经常会出现幻觉,但依靠产品设计和对话的拟人感,豆包深入人心。

在大语言模型上,字节虽然落后一截,但在多模态领域一骑绝尘。Seedance2.0 是行业首个实现规模化商业落地的视频生成基座,短剧赛道渗透率接近 95%,今年 4 月直接拉动火山引擎 MaaS 业务全年营收目标上调至 150 亿元,是 2025 年全年 MaaS 收入的十倍。2.5 版支持 30 秒长视频直出,已形成影视短剧、工业可视化等多场景 ToB 闭环。

近日刚发布的 Seed-Audio 1.0 音频生成模型,被业内视作音频领域的 "Seedance 时刻 ",区别于传统文本转语音工具,它可一次性生成对白、背景音乐、环境音效完整音频,单次最高产出 2 分钟长素材。目前已在火山方舟开放企业 API 邀测。

C 端产品豆包和 Seedance 视频生成模型是字节跳动最突出的成绩,凭借在短视频领域完整的生态闭环,Seedance 系列很可能成为字节大模型领域的摇钱树。

在 To B 领域,无论是其 Maas 产品火山方舟、还是全员办公 AI 助手 Trae Work,字节和阿里都有明显差距。

火山引擎希望靠低价获得市场份额,IDC 报告显示,按照 Token 调用量,字节跳动火山引擎以 49.5% 的份额位居中国第一。紧随其后的是阿里云(28%) 和百度智能云(10%)。

但按照营收来算,Omdia 报告显示,阿里云以 38.1% 的总份额(在 AI 云市场)稳居第一。在更细分的模型生产服务(MaaS-MPS) 市场,阿里云份额更高达 42.3%-。该报告显示,火山引擎排名第二,份额为 20.4%-。

基础设施上,字节自研云端推理芯片 SeedChip 团队规模已超千人,计划依托三星 6nm 工艺代工,2026 年 3 月底完成流片并产出首批工程样片,年内小批量量产 10 万颗,全部供内部使用。

因此,虽然字节也已经具备完整的战略形态,但在进度上,尤其是自研芯片上,和阿里仍有一定差距。

而将实用主义发挥到极致的腾讯则选择了另外一条路,他更倾向于侧重生态合作与满足自身核心业务需求。腾讯及其一致行动人在被号称为 " 国产 GPU 四小龙 " 之一的燧原科技的持股高达 20%,是其最大股东。

在基础模型层,腾讯正在努力拉平和头部的差距。

2026 年 4 月 23 日发布的 Hy3 preview(混元 3.0 预览版),相较前代 Hy2 在几乎所有关键指标上都实现了质的飞跃。凭借在 " 强推理 +256K 超长上下文 " 的能力,Hy3 preview 曾连续登顶 OpenRouter 全球周榜。市场份额升至 12.8%,位列行业第三。

腾讯务实的风格还表现在产品层。腾讯更侧重和集团原有的业务场景结合,比如微信 Agent 小微,企业微信 Agent 大圆,以及办公桌面助手 Workbuddy。高层的判断是,AI 竞争已进入 " 下半场 ",竞争焦点正从模型本身的参数比拼,转向场景、数据与实际应用效果的较量,而丰富的内部场景可以作为 " 磨刀石 "。

腾讯早期类 Chatbot 产品元宝虽然在春节期间发了 10 亿现金红包抢用户,但互联网时代的流量打法并不适合大模型,2 月 1 日活动当天,元宝冲上了苹果应用商店免费榜榜首。然而 2 月 22 日尚在第 10 位,次日(23 日)便跌出前 30 名。这也是腾讯在 C 端大模型产品的首次挫折。

一改去年的冷静克制,腾讯 AI 在今年开始大举发力。

眼下,Workbuddy 的表现最为亮眼,其重要性已经超过了元宝,今年 3 月,WorkBuddy 月访问量达到 885 万,是第二名的两倍还要多。目前,该团队依然在大规模招兵买马。

微信 Agent 小微已经开启灰测,主模型是微信团队自研的 WeLM,而非腾讯集团的混元大模型,WeLM 的配置极度节约算力,不追求最强,而是最适配。未来,用户可以在微信里点外卖,打车,生成工作日报等。

图注:字节跳动、阿里巴巴、腾讯主要 AI 产品一览,制图:Tech 星球。

在完成了芯片、模型及应用层的内功修炼后,三家大厂在战略落地上的另一个重要分水岭,是对外投资与资本生态的构建。

对外投资最为激进的当属阿里。这高度符合阿里云的基础业务战略:做大模型时代最核心的智能算力与云服务供应商。

阿里敏锐地意识到,大模型创业公司是未来算力消耗的最大金主。因此,阿里选择复刻微软与 OpenAI 的结盟模式,采用 " 算力 + 现金 " 的混合模式,将国内几乎所有头部的 AI 独角兽(包括智谱 AI、月之暗面、MiniMax、阶跃星辰、百川智能、零一万物)悉数收入其资本版图。

对于阿里而言,这并非纯粹的财务投资,更是 " 投资即获客 "。例如,MiniMax 在 2025 年前三季度就向阿里采购了约 5840 万美元的算力。

腾讯依然在延续其移动互联网时代的战略习惯。

彼时,腾讯确立了核心 " 社交与内容 " 的原则,通过投资,将流量红利分给京东、拼多多、美团、快手等企业,构建了一个庞大的泛腾讯生态联盟。到了 AI 时代,腾讯正尝试复刻这一神话。

腾讯的投资并不追求对算力订单的绝对掌控,而是更看重模型在具体产业和消费场景中的落地能力。它同样重仓了曾经 "AI 六小龙 " 中除去零一万物之外的五家,并且砸下 100 亿,成为 DeepSeek 首轮融资最大的外部投资者之一。

其核心逻辑是:利用外部力量,快速验证大模型在腾讯擅长的社交(微信 /QQ)、游戏、SaaS(腾讯会议)等场景中的可靠性。比如,DeepSeek 已经成为了元宝唯二可选的基模,与混元并列。

最特例独立的是字节,时至今日,字节跳动几乎没有投资任何一家外部的大模型创业公司。

" 一毛不拔 " 的背后,是字节这种极其强悍的 " 业务战略 " 在作祟。字节本质上是一家 App 工厂与流量收割机,它的核心逻辑是:用最敏捷的算法、最贴近用户的场景,在内部跑出最能变现的产品。

这三种风格,没有高下对错之分,更多的是企业针对自身风格和定位做出的选择。字节的纯自研模式 vs 阿里的 " 算力 + 独角兽军团 "、腾讯 " 流量生态资本 + 红利 " 终将在未来迎来终极对决。

一个终极目标,一场没有参考的必胜之战

尽管路径不同,但三家的最终目标高度一致——成为 AI 时代的超级入口。

在移动互联网时代,腾讯占据了社交,阿里占据了交易,字节则垄断内容和娱乐,他们早已成为国民级 App。但 AI 改写了竞争的规则,一个根本性的变化在于:移动互联网时代,用户在不同需求之间切换,需要主动打开不同的 App;而 AI Agent(智能体)的终极形态,是一个入口调度一切,可以调用工具、检索信息、购物、打车。

这意味着,AI 时代很可能不会再有一个 " 独占式超级入口 ",传统 App 之间的壁垒正在消融。

在这场必赢之战的残酷性在于,过去 20 多年积累的互联网时代的成功经验可能是负担,如果继续沿用流量惯性去做大模型产品,那很可能越做越亏。

日活 3.3 亿的豆包,每天需要支付数千万成本,但营收不足百万。元宝红包大战后,日活甚至回到了活动前的水平。从边际成本为 0 的互联网模式,到边际成本为正且刚性的大模型模式,流量会吞噬利润。且非高质量的对话也会污染数据池,数据飞轮也在失效。

因此,过去几年,互联网公司花费了数千亿美元,以为是在 " 烧钱换规模 ",但实际上,斥巨资购买的是对大模型世界游戏规则的一次认知升级。

结果是,当下竞争的维度已经从单独的 " 谁能让用户打开 AI" 到 " 谁能让 AI 完成真实任务 "。微信和支付宝先后推出 Agent 版本,豆包也开始强调自己的办事功能。巨头们已经意识到:AI 入口的护城河不是用户时长,而是任务完成率。

阿里、腾讯、字节这三家收入最丰厚的公司拥有最高的筹码:足够的现金,丰厚的算力储备,在数次战争中累积的战略定力。这足以让其他玩家望尘莫及。

但对于第一梯队的三位顶级玩家而言,这些只能让他们不被淘汰。跳出既有的路径依赖,出牌的顺序与节奏才是制胜的关键。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 ai 腾讯 吴泳铭 互联网
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论