作者 | 周智宇
编辑 | 张晓玲
当全世界还在争论大模型是否只是一个昂贵的 " 泡沫 " 时,金山云高级副总裁刘涛表示,这不是泡沫。
支持他论断的,是正在发生的 "Vibe Coding(沉浸式开发)" 热潮——当 Claude Code 已经可以熟练地用自己写的代码来迭代自身时,机器人造机器人、代码写代码的 " 奇点 " 已经真实地触碰到了产业界的脊梁。
面对这个变化,金山云出招了。1 月 21 日,金山云宣布智算平台 " 金山云星流 " 全面升级,其不仅包含了覆盖模型全生命周期的训推平台,还正式发布了机器人平台和模型 API 服务。
这家老牌云服务商正试图通过身份的自我重塑,积极投身这场关于未来生产力主导权的角逐。
过去一年,智算需求持续增长,主要推手已从头部企业的训练需求,悄然转向了推理侧的爆发。
数据非常直观,火山引擎日均 Token 调用量已冲上 50 万亿大关;豆包、千问、元宝等模型的外溢需求正以不可思议的速度扩张。这种爆发式的 Token 消耗,本质上是 AI 落地现实场景的过程。对于企业而言,大模型不再是 PPT 里的点缀,而是实打实的降本增效工具。
" 我们一直在关注推理什么时候爆发,这种增速超过了过去所有 IT 基础设施的认知。" 金山云助理总裁孙晓感慨道。
在这种背景下,金山云将自己定位为工程化的陪伴者,其逻辑非常纯粹:既然大模型正成为万物互联的 " 大脑 ",那么云厂商就需要提供配套的 " 循环系统 " ——稳定、高效且具备极致性价比的 Token 服务。
金山云走的是一条 " 任务驱动 " 的逻辑演进路线。2023 年,行业主题是 " 大规模智算网基础设施建设 ",比拼的是对底层异构资源的管理能力。2024 年,重点演进为 " 平台化和 Serverless(无服务器计算)",核心是将资源交付转变为任务交付。而到了 2026 年,升级后的 " 金山云星流平台 " 则锚定了三个核心主题:追求效率提升、构建行业平台、加速推理落地。
这种转变在于,智算时代的训练任务极其脆弱,在大规模算力集群下,任何一点硬件波动都可能导致整个训练任务的中断。为了解决这个 " 钉子 ",金山云自研了一套基于故障感知的自愈技术。
这套系统能针对硬件故障和软硬结合故障进行分级处理。有些故障重启即可,有些则需立即启动替换策略。孙晓透露,这套机制可以实现 " 秒级感知 " 和快速处理。这意味着,即便底层硬件出现波动,客户的一轮训练任务也能在不中断的情况下平稳度过。
具身智能,是金山云眼中智算云的 " 下半场 ",也是金山云重点关注的未来。
无论是自动驾驶还是人形机器人,行业目前仍处于一个 " 混沌场景 " 中,百花齐放但痛点固化。不同厂商有的关注大脑,有的关注小脑,有的则卡在数据仿真上。
金山云发布的 " 金山云星流机器人平台 ",试图打通从数据采集、存储、标注到模型训练、部署与仿真的全链路闭环。孙晓认为,机器人场景需要解决的是 " 从算法研发到真实场景部署 " 的落地难题。
以自动驾驶为例,模型在车端,但训练在云端,这对算力密度的要求或许没那么高,但对显存和多模态点云数据的处理能力要求极高。金山云通过构造闭环的数据平台,让客户能更便捷地接收、处理这些海量数据。
刘涛在展望未来时描绘了一个画面:2026 年起,家庭场景机器人将逐步落地。从最初帮老人捡袜子、捡毛巾,到最终辅助生活,这是一个跨度长达 5 到 10 年的万亿赛道。而金山云要做的,就是成为这个万亿赛道的 " 底座 " 和 " 引擎 "。
随着传统公有云市场进入存量博弈,智算云正带来全新的增长机会。金山云能够在去年三季度实现 120% 的同比增速,本质上是因为它抓住了这一波生产力重构的机会。
坚持 " 不做大模型 " 的承诺,反而让金山云在生态建设上变得极度开放。孙晓坦言,他们的职责是基于开源模型,依托自研技术,提供最稳定、最高性价比的 Token 服务。业内热门模型一发布,金山云当天就能上线推理服务,这种响应速度在行业内也处前列。
在智算时代,配套产品正在发生剧变。过去是计算、存储、网络,现在则是以推理加速为核心的技术栈(包括引擎、算子优化),以及围绕 Agent(智能体)构建的生态。金山云正通过 PD 分离(预填充和解码分离)以及量化技术,极致压低推理时延,提升吞吐性能。
甚至在某些爆款游戏的背后,金山云也在提供全栈云服务。在重负载、高并发的开服阶段,金山云通过平台化 + 工程师重保的机制,平稳支撑了海量玩家的涌入。这种从游戏重保中沉淀下来的极限压测经验,正被移植到大模型推理的战场上。
过去十年的云市场,是一场关于资源规模的博弈,云厂商扮演的是类似水电煤的 " 公用事业 " 角色。到了 2026 年,技术端的 " 内卷 " 仍将继续。从更大的参数量到更先进的计算方式(如 MLA 或线性 Attention),国内的大模型厂商依然在疯狂追求效率的极限。
但真正的分水岭在于 " 应用 "。视频生成的实用化、VLA 模型在车端与机器人端的泛化、以及 Agent 在老百姓日常生活中的渗透,将让推理需求呈现指数级增长。
智算云的红利期不会永远持续,只有那些能解决极限工程难题、能打通行业数据闭环、能提供极致性价比 Token 的厂商,才能在潮水退去后依然立于潮头。
" 我们已经打下了良好的客户基础,未来 3 到 5 年,金山云会有一个显著的变化。" 刘涛信心满满。
当智算的齿轮加速转动,这场关乎生产力主导权的竞赛,才刚刚进入最残酷、也最精彩的深水区。


