起点财经 16小时前
华为抢走了英伟达的剧本
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

The following article is from 中国企业家杂志 Author 闫俊文

作者:《中国企业家》记者 闫俊文

见习编辑:李原

编辑:何伊凡

来源:《中国企业家》杂志(ID:iceo-com-cn)

文章已获授权

" 华为云不追逐 Token 数量,也不在乎收入总量。"

今年 5 月,英伟达 CEO 黄仁勋对媒体坦言:" 很大程度上,我们已经把中国 AI 芯片市场,让给华为了。"

事实的确如此,华为正从 Plan B 选项跃升为至关重要的 AI 算力支撑平台,并吸引了一批互联网大厂主动 " 迁移 " 至华为云。

《中国企业家》获悉,小红书大模型基建部门披露,目前,小红书 MaaS 规模已达日均万亿级 Token 规模,约有 40% 的 Token 计算在昇腾系列芯片上运行。未来 3 个月,小红书计划将昇腾的推理产能提升至 60%,长期目标是让昇腾成为其 AI 推理底座。

除了小红书,华为云的客户名单上还有美团、B 站、DeepSeek、月之暗面和更多互联网大厂。

华为基于 910C 芯片的 A3 超节点,以及将在不久后推出的 950 芯片系列超节点,也被大厂抢先下单。一家计算服务器公司的高层告诉《中国企业家》:" 在推理需求的带动下,2026 年,互联网大厂对超节点的需求猛增,订单已经排到了两年后。"

字节、阿里围绕 MaaS、Token 消耗激战正酣之际,华为却不准备进入热战中心,而是将注意力投向 to B 和产业落地。

6 月 5 日,在 " 华为云创想者峰会 " 上,华为公司董事、华为云 CEO 周跃峰公布了华为云的开放战略,拥抱 " 百模千态 " ——开源模型即日可部署,上线 " 智果园 " 智能体平台,提供包括智谱、Kimi、DeepSeek 在内的开源模型接入。

周跃峰   来源:受访者

会后,周跃峰告诉《中国企业家》等媒体,华为云不追逐 Token 数量,也不在乎收入总量。" 我们看重每一个 Token 给生产力带来的价值,尤其是落地 to B 行业带来的价值。"

周跃峰以金融举例:" 我们要看防范了多少金融风险,提升了个人多少工作和信贷业务的效率等。不能简单说,产生了多少 Token,模型被调用了多少次,这是没有意义的。"

一位资深投资人告诉《中国企业家》:华为云与华为计算,未来对标的是英伟达。

除了直接卖 GPU 算力," 华为云 + 华为计算 " 也仿效英伟达,搭建起算力集群、超节点与高规格基础设施。" 价值导向 " 而非 " 规模导向 " 的定位,也让华为将主攻方向锁定在公共云赛道,重点服务政企、金融、汽车等领域。

在行业 AI 解决方案上,英伟达布局了工业孪生、汽车智驾芯片、机器人大脑模型等领域;华为则推出了具身智能、智慧医疗、智能制造、科学发现等 4 类行业 AI 工厂。

黄仁勋将英伟达的故事描述为 "Token 工厂 ",追求高吞吐,低成本。最近,华为半导体业务部总裁何庭波宣布了韬(τ)定律,提出了芯片的逻辑折叠技术。

华为云峰会上,周跃峰也提出了一个新公式:Agentic Infra 新范式 = 高效 Token 工厂 + 持续学习 + 通智一体化调度 + 安全自治。

摄影:闫俊文

不过,华为还需要补齐大模型一块关键拼图。采访中,周跃峰没有太多提及自家 " 盘古 " 大模型。

上一次盘古大模型版本更新还是在 2025 年 6 月。2026 年 3 月,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤宣布离职。而《中国企业家》获悉,华为自研的盘古大模型正在推倒重来,预计下半年会推出新版本。

不追逐 Token 数量

Token 消耗和销售的战事,还在不断升级。6 月 8 日,阿里宣布合并通义大模型事业部和未来生活实验室,成立 Token Foundry 事业部,由集团 CEO 吴泳铭直接负责。

豆包则是在 6 月内测推出专业版,一脚踏进订阅付费领域。媒体报道称,字节负责模型研发的 Seed 团队今年的重点是:世界模型、视频模型、Coding 和办公场景的商业化。

华为云则选择从三个层面与对手实施差异化竞争:开放模型、AI Coding 与 RL(强化学习)的产业落地。

一位华为云前置销售告诉《中国企业家》,友商对卖 MaaS 和 Token 给予了超额激励,华为云也给了销售人员卖 Token 一定的压力。

但考虑到华为盘古大模型 " 目前不是主推模型 ",该销售表示,华为考核的是客户在华为云上对第三方模型的 Token 消耗。但面对未来,该销售仍然乐观。AI 发展还在初期," 用户就像流水一样,他们会随着价格、模型能力等流动 "。

用周跃峰的话说,在智能体时代,华为云要成为一朵最开放的云。6 月 5 日的大会现场,华为云携手智谱、DeepSeek、MiniMax、月之暗面、阶跃星辰、百度、美团 LongCat、讯飞星火、爱诗科技、生数科技等 20 余家头部 AI 厂商,发布了 " 百模千态,云聚共赢 " 的生态合作计划。

来源:受访者

华为云也在强化销售体系,华为高级副总裁、华为云全球营销服总裁杨友桂在演讲中说,加强与伙伴的合作永远不动摇。未来华为云 50% 的收入将来自华为直销,50% 来自伙伴销售。华为云要让伙伴:更信任、更挣钱、更简单、更好成长。

除了行业大客户,华为云还推出了 OPC(超级个体)创新支持计划,提供包括算力与 AI Coding 等工具的支持。在 AI Coding 战场,华为云上线了 AI 编程智能体 " 码道 "(CodeArts)。周跃峰表示,华为云将以 " 范佛里特弹药量 "(不计成本)来打造这一能力。

虽然华为云没有披露盘古大模型训练的最新进展,但周跃峰表示:强化学习与企业数据,是行业落地非常关键的一个步骤。" 调整模型参数已经解决不了行业落地问题,必须结合企业私有数据进行强化学习。比如需要分钟级创建万级沙箱,并且 RL 过程要可观测、可存储。"

软、硬、芯协同,瞄准公有云

华为云一位高层在演讲中判断,云计算已经跨入了 "Token 工业时代 "。

这意味着 Token 大基建时代正在到来。头部大模型公司 DeepSeek、月之暗面、智谱、MiniMax 仍在通过上市或持续融资储备更多的弹药,投入 AI 基础设施建设——主要是 Infra 层。

但周跃峰告诉《中国企业家》等媒体:不可能每一个机构和公司都打造万卡集群,公共云才是承载超大规模通用大模型的最优解。" 通过机密推理和训练,平衡安全和资源高效共享。"

公共云是华为云主攻的市场,也是阿里、百度、腾讯等厂商集中炮火的领域。对华为云来说,其核心优势在于软、硬、芯的协同:

其中软件层指模型路由、Agent 运行环境等 Infra 工具,实现硬件与模型的最优配合。华为云已上线 " 模型路由 " 能力,让智能体自主选择适配模型,运行成本可下降 20% 以上。

硬件层指超节点产品以及各类算力集群,华为的灵衢智算集群支持 10 万卡集群规模,单一集群达到 200EFLOPS 算力,并可将 Token 生成时延降低到 10 毫秒以内,千卡每秒吞吐高达 500 万 Token。

芯片层则是华为自研昇腾(AI)、鲲鹏(CPU)等芯片,可以提供算子优化、计算加速等各类支持。

更具前瞻性的是对 Agent 时代基础设施的重新定义。华为公司 Fellow、云系统首席专家余洲提出,传统计算机关注算力与内存的资源堆积,而 Agent 时代的计算机应关注 " 任务如何被拆解、调度、执行、访问状态,以及从错误中恢复 "。

" 未来的基础设施将以 Token 作为最小单位去考量," 余洲说," 不必暴露底层资源组成,重要的是如何高效生产、执行任务。"

业界普遍担忧,内存而非计算才是 Agent 时代的 " 卡脖子 " 环节—— KV Cache(键值缓存)大小与模型生成序列长度成正比,文本越长,缓存的 Key 和 Value 向量越多,显存占用越大。

为此,华为云推出 AMS Agentic(记忆存储解决方案),依托昇腾 NPU,构筑 PB 级超大上下文记忆空间,规模优于业界 1 倍;全新盘级存储架构与三合一芯片实现 TB 级记忆极速读取,整体性能领先业界 50%。

黑土地形成需要时间

5 月 25 日,华为半导体业务部总裁何庭波宣布,基于华为过去 6 年做出 381 款芯片的经验提出了新理论——韬(τ)定律。

韬(τ)定律以 " 时间缩微 " 替代 " 几何缩微 ",通过逻辑折叠等创新技术,压缩芯片内的走线距离、互联时延,提高电信号传输效率,让芯片从 2D 平面进化为 3D 立体,从而开拓出一条有别于追求制程纳米节点的新路。

周跃峰在采访中提到韬(τ)定律时表示:" 华为没有办法构建万国牌的硅基黑土地,我们的硅基黑土地会越来越厚。"

但黑土地的形成需要时间。一位半导体领域的投资人告诉《中国企业家》:华为提出韬(τ)定律,需要开放更多技术细节和进展,他们才会敢于出手投资产业链上下游。

生态的构建是一项长期的任务,也不是华为一家可以完成的事情。在峰会上,华为云宣布,要联合开发者在 " 黑土地 " 上共同打造 " 行业 AI 梦工厂 ",通过构建垂直领域开发社区,开放华为在医疗、自动驾驶、具身智能等领域积累的技术能力、工具链与行业实践经验,支持开发者落地。

这也与英伟达的路径形成了映射。英伟达正尝试将 CUDA 生态从数据中心扩展到 PC 和人形机器人领域,试图让所有算力场景都离不开它的标准。今年 6 月,英伟达又联合微软推出了全新 RTX Spark 智能体计算机。黄仁勋说:" 家庭 AI 超级计算机将像现代家电一样普及,这场 PC 再发明与智能手机的诞生同等量级。"

东北黑土地每形成 1 厘米厚的黑土,就需要 200 年至 400 年的时间。而英伟达的 CUDA 生态,也历经了十余年培养开发者黏性。对于华为云来说,这场硅基黑土地的长征才刚刚开始。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

the 中国企业家
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论