虎嗅APP 1小时前
AI开始等不起云了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

客户是否愿意为了 " 更快 " 持续多付钱

出品 | 虎嗅科技组

作者 | 梁卡尔

编辑 | 苗正卿

头图 | 云天畅想

云天畅想这轮融资,不能只看成一家边缘智算公司的补血。

6 月 17 日,云天畅想宣布完成超过 10 亿元人民币 E 轮融资,由中国互联网投资基金领投,中金资本等机构跟投。截至 2026 年 6 月,该公司累计融资超过 30 亿元人民币。伴随融资公布的,还有一个新战略宣布,公司定位从 " 边缘智算服务商 ",拓展为面向 AGI 时代的 " 实时智算织网 "。

可是,当普通大模型 Token 正在被大厂打成价格战,低时延、靠近终端的 " 实时 Token" 为什么还能卖出溢价?这是这轮融资背后的核心赌局。也就是说,云天畅想的客户是否会愿意为了 " 更快 " 持续多付钱。

过去两年,AI 基础设施的主角是超大规模数据中心。科技巨头堆叠数万张 GPU,训练更大的模型,争夺谁的模型更聪明的话语权。但当大模型开始进入应用阶段,行业矛盾正在变化。

更大的背景是,在这个转变过程中,Agent、Physical AI(物理 AI)、智能座舱、AIPC、智能硬件等新场景,对响应速度、并发稳定性和服务覆盖能力提出了更高要求,也推动算力基础设施从中心化部署走向分布式网络化布局。

" 过去大家只关心大模型的质量,但当 AI 走向规模化应用时,大家更关注成本、延时和交互的用户体验。" 云天畅想首席科学家张霖涛告诉虎嗅。

但问题是,从训练转向推理是算力需求结构变了,这不意味着边缘的崛起。推理市场同样会被大厂压价,云天畅想要做的就是,找出一个不按照普通 Token 价格竞争的市场。

张霖涛用了一个商业比喻来解释这种变化,那些位于偏远地区、规模宏大的中央算力中心,本质上是 AI 时代的 " 炼油厂 ",负责把原始数据 " 提炼 " 成高智商的模型;而云天畅想构建的分布式边缘智算网络,是密布在用户身边的 " 加油站 "。当用户的 " 汽车 "(智能终端)需要能量时,它不可能开到数千公里外的 " 炼油厂 ",它需要在最近的 " 加油站 " 进行即时加注。

这个比喻能解释边缘算力的必要性,但解释不了商业性。加油站赚钱的逻辑是高频次、稳定的毛利和明确的单位经济模型,而不仅仅是便利性。放在 AI 推理里,就是低延迟能不能形成溢价,边缘节点能不能赚到钱,云天畅想能不能定义价格。AI 硬件为何等不起云?

对云天畅想来说,其客户采购这类服务时,并不只看每百万 Token 价格,排序更靠前的是能否在不同地区落地服务,以及服务稳定性和质量。其客户通常有真实落地场景,对服务质量的要求高于单纯的价格敏感度。

云天畅想后续可能会考虑 Token 计价的产品,但至少在现阶段,价格并不是其客户采购时的第一权重。

低延迟不是护城河

实时 Token 是一个具有技术张力的核心赌注。

今天,卖云、卖算力、卖 Token,本质上正在变成同一场生意,谁的成本更低,谁的供应更稳定,谁就能在价格战里多活一轮。

普通 Token 的价格正在快速下探。文本问答、摘要翻译这类推理需求,标准化程度高、对延迟不极端敏感,天然适合被大厂、公有云和模型公司卷成规模化商品。

云天畅想并不想进入这个最拥挤的战场。云天畅想联合创始人、首席战略官徐公美的判断是,要卖技术含金量高的实时 Token。

所谓实时 Token, 不是一个单纯的技术概念,也不是一个成熟的标准计价单位,而是一类商业场景,如实时语音交互、AI PC、智能座舱、游戏 AI 等现有的应用,以及未来的具身智能和物理 AI。这些场景的共同点是,用户不能等,这也是云天畅想找到的差异市场。

云天畅想面对的并不是单一类型客户,使用中心云、公有云模型 API、自建推理集群的客户都有,但更高频的共同诉求是低时延。原因有两层:一是时延直接影响用户体验,体验下降会带来用户流失;二是低时延会创造新的交互场景,比如智能耳机、智能陪伴等需要实时反馈的终端应用。

不过,对于哪些任务最容易打出 ROI,云天畅想并未给出明确排序,只强调 " 低时延是核心场景 "。究竟哪一类场景最容易打出 ROI,仍需要更多客户案例验证。

一个聊天机器人慢两秒,用户可能还能接受,但游戏里的 AI NPC 反应慢半拍,沉浸感会被破坏,智能座舱和机器人更极端,很多交互和决策需要在毫秒级完成,不能把所有计算链路都拉到远端中心云。

张霖涛举了自动驾驶的例子,当车在路上行驶,留给障碍物识别并作出决策的时间通常只有数毫秒时间,这时候数据通过几千公里外的中央机房去计算。" 算完了再传回来,车可能直接就撞上了。所以这种必须在最近的边缘端搞定。"

严格来说,自动驾驶是一个容易被误用,但能说明方向的例子。安全闭环必须在车端完成,不能依赖远端云,边缘节点更可能承担协同感知、地图更新、仿真训练、内容与交互等任务。这个边界说明,越靠近物理世界,计算链路越需要分层。

这种影响在物理 AI 与具身智能领域体现的将更为明显。当一个具身智能机器人在复杂的物理环境中行走、抓取物体,其背后每秒钟产生的 Token 调用量和图形渲染需求,远超传统聊天机器人,且对延迟敏感,不能完全依赖远端中心云。这种刚性需求让大型数据中心遇到难以解决的物理困境。

云天畅想的方案是,未来的算力基础设施不再是堆砌孤立的机房,而是一种分布式网络化布局。该公司正在通过构建覆盖全球 300 多个城市的边缘智算网络,将算力节点直接推到距离用户 " 最后一公里 " 的数字边缘,从而有机会完成实时 Token 的商业布局,但短期内难以成为商业模型的主要支撑。

图片来源:云天畅想

从被误解的 " 云游戏 " 到 "GPU 原生 "

根据过往业务,云天畅想经常被贴上 " 云游戏 " 的标签。这既是它的起点,也一度限制了外界对它的估值想象。云游戏行业曾经热过,也冷过,市场对这个赛道的商业化耐心并不算高。但从另一面看,云游戏恰恰是最早验证边缘 GPU 能力的高压场景。

云游戏业务本质上是一套实时计算工程,对图形计算和算力压榨极为严苛、残酷,它要求在移动端实现超高画质的图形渲染,同时必须将端到端的流媒体传输延迟控制在毫秒级,否则玩家就会感到明显的卡顿。这类场景对 GPU 调度、低时延网络、异构硬件适配、峰谷负载管理等维度要求很高。

徐公美告诉虎嗅,云游戏公司是一种误解,云游戏是技术服务率先爆发的落地场景,但从底层架构和技术积累看,云天畅想并不认为自己只是一家游戏服务商。

张霖涛进一步解释," 云天畅想从成立第一天起,本质上就是一个 GPU 原生和边缘原生的分布式异构算力调度平台,所有的软件架构和网络传输,都是为了最大化释放 GPU 的能力而设计的 "。国家企业信用信息公示系统显示,当前公司实体深圳云天畅想信息科技有限公司成立于 2020 年 8 月,实际业务探索始于 2016 年。

云游戏和 AI 推理表面上,一个算图形,一个算 Token,但底层都需要 GPU 资源,都要求低延迟,都要处理高并发,都要在不同终端上保持稳定体验。" 从算图形变成算 AI(Token),对我们的底层架构来说,是一个自然而然、水到渠成的基因演进 ",张霖涛告诉虎嗅。

这是云天畅想试图重估自己的逻辑,它已经进入 AI 推理市场。张霖涛说," 当头部客户提出高性价比、低延迟的 AI 推理需求时,云天畅想能够快速转化商业落地,在边缘端实现大规模的实时智算服务 "。

但问题也在这里,云游戏能力能不能迁移到 AI 推理,不是靠一句 " 基因演进 " 就能证明的,更何况这背后还有商业的诉求。

真正的账,是怎么榨干 GPU 每一秒

当前 AI 基础设施赛道的投资泡沫已有所体现。一些独立算力服务商为了争夺大模型训练的订单,甚至盲目举债采购昂贵的芯片,导致毛利率为负,又或者单纯依赖持续烧钱来维持运转,其商业模型的健康度受到质疑。

云天畅想这门生意能不能跑通,维持毛利率,核心在于同一批 GPU 能不能在更多时间里赚钱。

云天畅想给出的解法是 " 算力复用 "。按照其设想,边缘节点并不只服务单一场景。白天,服务器可以承接互联网平台的视频处理、大模型推理、智能座舱交互、企业 AI 任务;到了中午、傍晚或深夜等闲暇时段,算力又可以被调度到云游戏、实时渲染等场景。

如果这些负载能够错峰互补,GPU 利用率就会被抬高,单个硬件的投资回报周期也会缩短。但这仍然是一个需要验证的商业假设。

更细的成本拆解目前云天畅想并未完全披露。这意味着,外界目前还很难判断其成本优势究竟来自哪里。对一家边缘智算公司来说,低时延是前台卖点,但后台真正决定利润率的,仍然是 GPU 利用率和单位算力成本。

云天畅想目前公开披露了覆盖全球 300 多个城市的边缘智算网络,也强调与运营商、内容平台、云服务商协同。但不同业务的负载是否真的能够错峰?边缘节点的平均利润率是否达标?这些如果不能持续兑现," 实时 Token" 就仍然只是一个好听的概念。

云天畅想另一个能力是国产芯片适配。

训练阶段,英伟达凭借 CUDA 生态、单卡性能和开发者体系,优势仍然明显。但推理阶段的逻辑有所不同。很多推理任务未必需要最顶级的单卡峰值算力,客户更关心性价比、功耗、稳定性和综合成本。

张霖涛认为,AI 进入推理阶段后,国产芯片迎来了新的市场空间。" 因为推理是面向具体业务场景的。一些大厂或者政府项目客户对底层的国产化率是有要求的。这时候,国产芯片如果能在某些特定场景下做好适配,把功耗降下来,性价比做上去,它就能很好地满足需求。"

他说,云天畅想要做的,就是帮国产芯片做好底层异构调度和调优。徐公美也透露,云天畅想在底层已与约 90% 的国产芯片厂商建立合作。多厂商、多架构芯片的异构调度与调优,确实可能成为云天畅想在特定市场中的竞争壁垒。

但国产芯片适配不是万能钥匙,英伟达的优势仍然明显,对云天畅想来说,国产芯片适配是苦活累活。换句话说,这个过程中的成本不容忽视。

在 E 轮的投资节点上,云天畅想提出 " 实时智算织网 " 的战略,押注在 AI 推理会在边缘端需求更多。但问题是,实时 Token 是否真有足够溢价,还要靠客户付费验证。很多客户最终可能会在端侧、本地私有云和中心云之间做成本权衡,而不是简单选择边缘节点。

不仅如此,物理 AI 仍是远期的商业蓝图,不是短期的现金流。机器人、自动驾驶和具身智能固然有更复杂的实时算力需求,但大规模商业化节奏并不明确。因此,融资背后是,在 Token 价格战之下,低延迟是否能拉起价格。

只有客户愿意持续付费买单,云天畅想才会抬高估值。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 融资 虎嗅 基础设施 科技巨头
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论