和讯网 03-17
黄仁勋和马云都在抢,看清Token背后的商业模式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

昨晚,英伟达 CEO 黄仁勋发表 GTC 2026 主题演讲。就在前一天,阿里巴巴成立 Token Hub 事业群,CEO 吴泳铭亲自挂帅。

两家巨头,同一天,盯上同一个东西:Token。Token 到底怎么赚钱?咱们今天把它讲清楚。

Token 是什么?

黄仁勋给了一个比喻:Token 是数字世界的石油

你问 ChatGPT 一句、生成一段视频、让机器人动一下,消耗的都是 Token。它是 AI 理解和生成信息的基本单位,也是未来所有智能服务的计量单位。

Token 怎么收费?企业要付多少钱?

黄仁勋在演讲中首次公开了 Token 的分层定价体系。这不是概念,是真金白银的收费标准:

免费层:高吞吐量、低速度,用于吸引用户

基础层:每百万 Token 3 美元,服务普通用户

进阶层:每百万 Token 6 美元,更大模型、更快速度

高速层:每百万 Token 45 美元,支持长上下文、深度推理

顶级层:每百万 Token 150 美元,面向超长研究任务、关键路径实时响应

黄仁勋算了一笔账:" 一个研究员每天用 5000 万 Token,按每百万 150 美元计算,对一个研究团队来说完全可以接受。"

这意味着什么?Token 不是一次性买卖,而是持续性消耗。你今天烧完,明天还得烧。只要 AI 还在跑,Token 就在烧。

CUDA 的商业模式:为什么黄仁勋敢说 " 算力越用越便宜 "

那英伟达怎么靠 Token 赚钱?核心是CUDA。你可以把它理解成 AI 世界的 " 操作系统 "。所有 AI 应用都得跑在 CUDA 上,就像所有手机应用都得跑在安卓或 iOS 上。

CUDA 的护城河是数亿级的安装基数

英伟达花了 20 年时间,让数亿块 GPU 跑 CUDA 系统,进入每一朵云、每一家计算机公司、几乎每一个行业。这个安装基数造就了一个飞轮效应:安装基数大,吸引全球开发者;开发者创造新算法,催生新市场;新市场需要更多算力,进一步扩大安装基数。

飞轮转动的结果,就是算力成本持续下降。

黄仁勋举了一个反直觉的例子:六年前出货的 Ampere 架构 GPU,现在在云端的定价反而在上涨。为什么?因为在这块老芯片上能跑的应用越来越多,而且英伟达每优化一次软件,所有存量用户都能免费提速。

这意味着什么?你今天买的算力,过几年不仅不过时,反而可能更值钱。这在硬件行业,几乎是天方夜谭。

黄仁勋的原话是:"一旦安装了 NVIDIA GPU,就能获得长期的性能迭代。不仅是初期的加速,更是持续的成本降低。"

这就是 CUDA 的商业模式:靠硬件建立安装基数,靠软件持续创造价值,靠生态锁定用户。全球数亿块 GPU 都在跑 CUDA,每消耗一个 Token,都得从英伟达的平台过一遍。

这就把整个商业逻辑改了。以前企业买 AI 卡,是一次性开支,属于资本支出。买了就完事,后面跟供应商没关系。现在 AI 卡变成生产 Token 的生产线,企业花钱从 " 买设备 " 变成了 " 买燃料 "。今天烧完明天还得买,从一次性开支变成了持续性运营。

这叫收租。你今天交,明天还得交。

阿里为什么连夜进场?一场不得不打的硬仗

再看阿里这边的动作。3 月 16 日,阿里巴巴成立 Alibaba Token Hub 事业群,CEO 吴泳铭亲自挂帅,把目标拆成三块:创造 Token、输送 Token、应用 Token

阿里为什么要这么急?

核心痛点在于:AI 能力太分散。过去两年,阿里的 AI 散落在通义实验室、阿里云、钉钉、淘天等各个体系,各团队各干各的,资源重复投入,协同成本越来越高。用户认知也很模糊——通义千问、千问 App、夸克 AI,同一套技术冒出好几个产品,用户根本分不清。

就在 12 天前," 千问灵魂人物 " 林俊旸突然离职,背后正是 " 科学家想发论文、管理层想要营收 " 的撕裂。这种冲突在 AI 行业并不少见。

吴泳铭的解法很直接:把 Token 变成唯一的指挥棒。未来阿里的评价体系,不再争论技术路线谁对谁错,而是直接折算成 Token 的调用量和营收。能带来 Token 增长的部门留下,不能的边缘化。

更深层的逻辑是:阿里判断,未来所有数字化工作,都由数以百亿计的 AI Agent 支撑。吴泳铭在内部信中直言," 这些 AI Agent 将由模型产生的 Token 支撑运行 "。而 Agent 不睡觉,24 小时运转,意味着 Token 需求是持续性的、高频复购的。

如果把 Token 比作 AI 时代的 " 电 ",两家巨头的角色很清晰:英伟达是 "发电设备制造商"。它卖发电机、建发电厂,靠 CUDA 生态锁定客户,让所有 AI 应用都得从它的平台过一遍。

阿里是 "电网公司 + 用电大户"。它有通义实验室负责创造 Token,有 MaaS 平台负责输送 Token,还有千问、悟空这些负责消耗 Token。从 C 端的 AI 助手,到 B 端的企业工作流,阿里想打通 " 发电 - 输电 - 用电 " 的完整闭环。

谁的优势更大?英伟达有技术壁垒和生态锁定,单位 Token 成本有压倒性优势。阿里有场景和数据——电商、云、钉钉、高德、饿了么,每天产生海量数据 ( 603138 ) ,也每天消耗海量 Token。如果能把闭环跑通,Token 在阿里体系内就能自我循环、自我增值。

巨头已经在真金白银抢赛道了。

Token 生意的终局

Token 这个生意,本质是把算力从 " 资产 " 变成了 " 服务 "。从一次性买卖,变成了持续收费。从卖铲子,变成了卖石油。

谁掌握了最低的 Token 生产成本,谁就掌握了 AI 时代的定价权。

英伟达有 20 年积累的 CUDA 生态,有数亿的安装基数,有每优化一次软件就能惠及所有用户的规模优势。阿里有完整的业务场景,有把 Token 当成战略资源来打的决心。

两家巨头,同一个判断:Token 是 AI 时代的硬通货。至于英伟达的股价什么时候能回来?等市场不再把它当硬件公司,而是当 AI 基础设施平台估值的那一天

(责任编辑:曹言言 HA008)

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

黄仁勋 英伟达 ai gpu ceo
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论