AI开始等不起云了

客户是否愿意为了 " 更快 " 持续多付钱

出品 | 虎嗅科技组

作者 | 梁卡尔

编辑 | 苗正卿

头图 | 云天畅想

云天畅想这轮融资，不能只看成一家边缘智算公司的补血。

6 月 17 日，云天畅想宣布完成超过 10 亿元人民币 E 轮融资，由中国互联网投资基金领投，中金资本等机构跟投。截至 2026 年 6 月，该公司累计融资超过 30 亿元人民币。伴随融资公布的，还有一个新战略宣布，公司定位从 " 边缘智算服务商 "，拓展为面向 AGI 时代的 " 实时智算织网 "。

可是，当普通大模型 Token 正在被大厂打成价格战，低时延、靠近终端的 " 实时 Token" 为什么还能卖出溢价？这是这轮融资背后的核心赌局。也就是说，云天畅想的客户是否会愿意为了 " 更快 " 持续多付钱。

过去两年，AI 基础设施的主角是超大规模数据中心。科技巨头堆叠数万张 GPU，训练更大的模型，争夺谁的模型更聪明的话语权。但当大模型开始进入应用阶段，行业矛盾正在变化。

更大的背景是，在这个转变过程中，Agent、Physical AI（物理 AI）、智能座舱、AIPC、智能硬件等新场景，对响应速度、并发稳定性和服务覆盖能力提出了更高要求，也推动算力基础设施从中心化部署走向分布式网络化布局。

" 过去大家只关心大模型的质量，但当 AI 走向规模化应用时，大家更关注成本、延时和交互的用户体验。" 云天畅想首席科学家张霖涛告诉虎嗅。

但问题是，从训练转向推理是算力需求结构变了，这不意味着边缘的崛起。推理市场同样会被大厂压价，云天畅想要做的就是，找出一个不按照普通 Token 价格竞争的市场。

张霖涛用了一个商业比喻来解释这种变化，那些位于偏远地区、规模宏大的中央算力中心，本质上是 AI 时代的 " 炼油厂 "，负责把原始数据 " 提炼 " 成高智商的模型；而云天畅想构建的分布式边缘智算网络，是密布在用户身边的 " 加油站 "。当用户的 " 汽车 "（智能终端）需要能量时，它不可能开到数千公里外的 " 炼油厂 "，它需要在最近的 " 加油站 " 进行即时加注。

这个比喻能解释边缘算力的必要性，但解释不了商业性。加油站赚钱的逻辑是高频次、稳定的毛利和明确的单位经济模型，而不仅仅是便利性。放在 AI 推理里，就是低延迟能不能形成溢价，边缘节点能不能赚到钱，云天畅想能不能定义价格。AI 硬件为何等不起云？

对云天畅想来说，其客户采购这类服务时，并不只看每百万 Token 价格，排序更靠前的是能否在不同地区落地服务，以及服务稳定性和质量。其客户通常有真实落地场景，对服务质量的要求高于单纯的价格敏感度。

云天畅想后续可能会考虑 Token 计价的产品，但至少在现阶段，价格并不是其客户采购时的第一权重。

低延迟不是护城河

实时 Token 是一个具有技术张力的核心赌注。

今天，卖云、卖算力、卖 Token，本质上正在变成同一场生意，谁的成本更低，谁的供应更稳定，谁就能在价格战里多活一轮。

普通 Token 的价格正在快速下探。文本问答、摘要翻译这类推理需求，标准化程度高、对延迟不极端敏感，天然适合被大厂、公有云和模型公司卷成规模化商品。

云天畅想并不想进入这个最拥挤的战场。云天畅想联合创始人、首席战略官徐公美的判断是，要卖技术含金量高的实时 Token。

所谓实时 Token，不是一个单纯的技术概念，也不是一个成熟的标准计价单位，而是一类商业场景，如实时语音交互、AI PC、智能座舱、游戏 AI 等现有的应用，以及未来的具身智能和物理 AI。这些场景的共同点是，用户不能等，这也是云天畅想找到的差异市场。

云天畅想面对的并不是单一类型客户，使用中心云、公有云模型 API、自建推理集群的客户都有，但更高频的共同诉求是低时延。原因有两层：一是时延直接影响用户体验，体验下降会带来用户流失；二是低时延会创造新的交互场景，比如智能耳机、智能陪伴等需要实时反馈的终端应用。

不过，对于哪些任务最容易打出 ROI，云天畅想并未给出明确排序，只强调 " 低时延是核心场景 "。究竟哪一类场景最容易打出 ROI，仍需要更多客户案例验证。

一个聊天机器人慢两秒，用户可能还能接受，但游戏里的 AI NPC 反应慢半拍，沉浸感会被破坏，智能座舱和机器人更极端，很多交互和决策需要在毫秒级完成，不能把所有计算链路都拉到远端中心云。

张霖涛举了自动驾驶的例子，当车在路上行驶，留给障碍物识别并作出决策的时间通常只有数毫秒时间，这时候数据通过几千公里外的中央机房去计算。" 算完了再传回来，车可能直接就撞上了。所以这种必须在最近的边缘端搞定。"

严格来说，自动驾驶是一个容易被误用，但能说明方向的例子。安全闭环必须在车端完成，不能依赖远端云，边缘节点更可能承担协同感知、地图更新、仿真训练、内容与交互等任务。这个边界说明，越靠近物理世界，计算链路越需要分层。

这种影响在物理 AI 与具身智能领域体现的将更为明显。当一个具身智能机器人在复杂的物理环境中行走、抓取物体，其背后每秒钟产生的 Token 调用量和图形渲染需求，远超传统聊天机器人，且对延迟敏感，不能完全依赖远端中心云。这种刚性需求让大型数据中心遇到难以解决的物理困境。

云天畅想的方案是，未来的算力基础设施不再是堆砌孤立的机房，而是一种分布式网络化布局。该公司正在通过构建覆盖全球 300 多个城市的边缘智算网络，将算力节点直接推到距离用户 " 最后一公里 " 的数字边缘，从而有机会完成实时 Token 的商业布局，但短期内难以成为商业模型的主要支撑。

图片来源：云天畅想

从被误解的 " 云游戏 " 到 "GPU 原生 "

根据过往业务，云天畅想经常被贴上 " 云游戏 " 的标签。这既是它的起点，也一度限制了外界对它的估值想象。云游戏行业曾经热过，也冷过，市场对这个赛道的商业化耐心并不算高。但从另一面看，云游戏恰恰是最早验证边缘 GPU 能力的高压场景。

云游戏业务本质上是一套实时计算工程，对图形计算和算力压榨极为严苛、残酷，它要求在移动端实现超高画质的图形渲染，同时必须将端到端的流媒体传输延迟控制在毫秒级，否则玩家就会感到明显的卡顿。这类场景对 GPU 调度、低时延网络、异构硬件适配、峰谷负载管理等维度要求很高。

徐公美告诉虎嗅，云游戏公司是一种误解，云游戏是技术服务率先爆发的落地场景，但从底层架构和技术积累看，云天畅想并不认为自己只是一家游戏服务商。

张霖涛进一步解释，" 云天畅想从成立第一天起，本质上就是一个 GPU 原生和边缘原生的分布式异构算力调度平台，所有的软件架构和网络传输，都是为了最大化释放 GPU 的能力而设计的 "。国家企业信用信息公示系统显示，当前公司实体深圳云天畅想信息科技有限公司成立于 2020 年 8 月，实际业务探索始于 2016 年。

云游戏和 AI 推理表面上，一个算图形，一个算 Token，但底层都需要 GPU 资源，都要求低延迟，都要处理高并发，都要在不同终端上保持稳定体验。" 从算图形变成算 AI（Token），对我们的底层架构来说，是一个自然而然、水到渠成的基因演进 "，张霖涛告诉虎嗅。

这是云天畅想试图重估自己的逻辑，它已经进入 AI 推理市场。张霖涛说，" 当头部客户提出高性价比、低延迟的 AI 推理需求时，云天畅想能够快速转化商业落地，在边缘端实现大规模的实时智算服务 "。

但问题也在这里，云游戏能力能不能迁移到 AI 推理，不是靠一句 " 基因演进 " 就能证明的，更何况这背后还有商业的诉求。

真正的账，是怎么榨干 GPU 每一秒

当前 AI 基础设施赛道的投资泡沫已有所体现。一些独立算力服务商为了争夺大模型训练的订单，甚至盲目举债采购昂贵的芯片，导致毛利率为负，又或者单纯依赖持续烧钱来维持运转，其商业模型的健康度受到质疑。

云天畅想这门生意能不能跑通，维持毛利率，核心在于同一批 GPU 能不能在更多时间里赚钱。

云天畅想给出的解法是 " 算力复用 "。按照其设想，边缘节点并不只服务单一场景。白天，服务器可以承接互联网平台的视频处理、大模型推理、智能座舱交互、企业 AI 任务；到了中午、傍晚或深夜等闲暇时段，算力又可以被调度到云游戏、实时渲染等场景。

如果这些负载能够错峰互补，GPU 利用率就会被抬高，单个硬件的投资回报周期也会缩短。但这仍然是一个需要验证的商业假设。

更细的成本拆解目前云天畅想并未完全披露。这意味着，外界目前还很难判断其成本优势究竟来自哪里。对一家边缘智算公司来说，低时延是前台卖点，但后台真正决定利润率的，仍然是 GPU 利用率和单位算力成本。

云天畅想目前公开披露了覆盖全球 300 多个城市的边缘智算网络，也强调与运营商、内容平台、云服务商协同。但不同业务的负载是否真的能够错峰？边缘节点的平均利润率是否达标？这些如果不能持续兑现，" 实时 Token" 就仍然只是一个好听的概念。

云天畅想另一个能力是国产芯片适配。

训练阶段，英伟达凭借 CUDA 生态、单卡性能和开发者体系，优势仍然明显。但推理阶段的逻辑有所不同。很多推理任务未必需要最顶级的单卡峰值算力，客户更关心性价比、功耗、稳定性和综合成本。

张霖涛认为，AI 进入推理阶段后，国产芯片迎来了新的市场空间。" 因为推理是面向具体业务场景的。一些大厂或者政府项目客户对底层的国产化率是有要求的。这时候，国产芯片如果能在某些特定场景下做好适配，把功耗降下来，性价比做上去，它就能很好地满足需求。"

他说，云天畅想要做的，就是帮国产芯片做好底层异构调度和调优。徐公美也透露，云天畅想在底层已与约 90% 的国产芯片厂商建立合作。多厂商、多架构芯片的异构调度与调优，确实可能成为云天畅想在特定市场中的竞争壁垒。

但国产芯片适配不是万能钥匙，英伟达的优势仍然明显，对云天畅想来说，国产芯片适配是苦活累活。换句话说，这个过程中的成本不容忽视。

在 E 轮的投资节点上，云天畅想提出 " 实时智算织网 " 的战略，押注在 AI 推理会在边缘端需求更多。但问题是，实时 Token 是否真有足够溢价，还要靠客户付费验证。很多客户最终可能会在端侧、本地私有云和中心云之间做成本权衡，而不是简单选择边缘节点。

不仅如此，物理 AI 仍是远期的商业蓝图，不是短期的现金流。机器人、自动驾驶和具身智能固然有更复杂的实时算力需求，但大规模商业化节奏并不明确。因此，融资背后是，在 Token 价格战之下，低延迟是否能拉起价格。

只有客户愿意持续付费买单，云天畅想才会抬高估值。

宙世代

一起剪

相关标签