天极网 03-24
从用不起到养得起:华为云三大引擎破解企业智能体落地难题
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2026 年开年,一款名为 OpenClaw ( 俗称 " 龙虾 " ) 的开源 AI 智能体迅速引爆全网。凭借出色的执行能力与极低的部署门槛,不仅打破了传统人工智能 " 只动口、难落地 " 的局限,更催生了企业对高性能、可落地智能体 ( Agentic ) 的广泛应用与深度部署,以实现降本增效与数智化升级的迫切需求。

面对这一浪潮,企业如何抓住智能体时代机遇,实现 AI 技术的规模化落地与商业价值转化?3 月 20 日,在华为中国合作伙伴大会 2026 上,华为云 CEO 周跃峰给出了清晰而坚定的答案:华为云将以行业智能体为中心,打造企业级 AI 创新的 " 黑土地 "。

华为云 CEO 周跃峰

告别算力浪费,柔性计算让 AI 走向好用

" 养龙虾 " 的火爆绝非偶然,它宣告了人工智能从对话走向行动的临界点已然到来。但智能体自主规划、多轮迭代、长上下文的特性,让 Token 消耗量呈指数级增长。

据摩根大通证券研报,2025 年至 2030 年,中国 AI 推理 Token 消耗量将从约 10 千万亿增长至约 3900 千万亿,五年间增长约 370 倍,年复合增长率高达 330%。传统算力整租模式下,推理池平均利用率不足 30%,重金投入的 AI 硬件算力池超半数处于 " 摸鱼 " 状态。算力浪费严重、成本居高不下,成为智能体规模化落地的最大拦路虎。

华为云判断,智能体时代的算力供给,必须从资源模式转向效率模式,而柔性计算正是破解这一难题的钥匙。

作为柔性计算的核心载体,华为云在本次大会上重磅推出柔性智算操作系统 FlexNPU,打破传统服务器固定配比与算力整租模式,赋予 NPU/GPU 算力 " 柔性液态化 " 供给能力,可依据业务需求动态伸缩、随需而动,彻底告别算力浪费与成本失控。FlexNPU 以三大极致属性,提供极致性价比的算力底座,让企业真正 " 养得起 " 智能体。我们具体来看:

极致共享,终结算力闲置。针对大模型推理场景,FlexNPU 创新采用 PD 动态混部、在离线推理混部技术,破解传统 PD 分离架构下 Prefill 与 Decode 集群资源不均衡、推理业务潮汐变化导致的算力空转难题,将大模型 Token 性价比提升至少 40%; 面向小模型推理场景,FlexNPU 实现最小粒度 1% NPU 卡、128MB 显存的 AICore 时分复用与显存空分复用,为小模型量身定制虚拟 NPU 资源,平均算力成本降低 2-3 倍。这一点对中小企业尤为关键,过去小模型不敢上云、用不起算力的困境,被柔性计算彻底打破。

极致弹性,适配业务潮汐。FlexNPU 打破传统服务器固定配比限制,支持算力资源按需定义、动态调度,无论是 OpenClaw 智能体突发的高并发请求,还是平稳期的低负载运行,都能精准匹配算力供给,无需为峰值资源长期付费,也无需担心低谷期资源闲置。这种按需取用、按量计费的模式,让算力从固定资产变为流动服务,适配智能体业务的动态特性。

极致高可用,杜绝故障重算。针对智能体推理会话易中断、重算成本高昂的痛点,FlexNPU 通过软硬解耦与 Token 级 KVCache 实时快照技术,实现硬件故障秒级恢复与断点续推,上层推理框架无需感知底层硬件异常,大幅减少重计算开销。在我看来,这一能力看似隐性,却直击智能体运行的核心痛点——中断即损失,稳定即收益,保障 OpenClaw 等智能体运行稳定流畅,本身就是在为企业降本增效。

不难看出,FlexNPU 早已不只是一项技术创新,它重新定义了智能体时代的算力供给规则:把算力从粗放到精细,从刚性到柔性,从浪费到高效,这不仅是算力基础设施的演进方向,也是华为云构建 AI 时代肥沃黑土地的底气。

跨越落地鸿沟,搭建智能体发展快车道

如果说 FlexNPU 解决了算力成本的 " 地基 " 问题,那么如何让企业快速 " 造得出 " 贴合自身业务的智能体,则是价值转化的关键一跃。

实际上,智能体要想普及,必须让开发变得简单。就像移动互联网时代,低代码平台让普通人也能开发 APP; 智能体时代,同样需要一站式开发平台,让企业无需精通 AI 算法,也能快速打造专属智能体。

对此,华为云发布一站式企业级智能体开发平台 AgentArts。平台搭载自研自演进引擎,整合开发态、运行态、运营运维态三大组件,同时支持低代码与高代码双模式,以安全沙箱保障运行安全,把智能体开发变成 " 搭积木 " 一样简单,让企业可快速构建高质量行业智能体,直接把 Token 流量转化为业务收益。据华为云实测,使用 AgentArts 可将智能体交付周期缩短 60% 以上,原本 3 个月的开发任务,几周即可完成部署上线,大幅降低智能体落地的技术与时间成本。

2026 年被业界定义为智能体元年。麦肯锡联合 QuantumBlack 发布的《2025 年人工智能的现状:智能体、创新和转型》报告,基于全球近 2000 位企业高管及从业者调研数据显示:62% 的受访企业已启动智能体试点应用,其中 23% 的企业已在内部场景中扩大部署规模。AgentArts 的推出,恰逢智能体从技术尝鲜走向规模应用的关键节点,提供了切实可行的落地方案,有效帮助企业跨越从技术尝鲜到规模应用之间的那道鸿沟。

读懂代码宇宙,打通与业务之间的壁垒

智能体的长期迭代与价值释放,最终回归代码本身。智能体要深度适配企业业务,离不开高效的代码开发工具,华为云码道 ( CodeArts ) 作为代码智能体,以 " 让 AI 理解企业整个代码宇宙 " 为目标,为智能体的开发和迭代提供了底层生产力工具,夯实了 " 用得好 " 的根基。

码道的竞争力来自 " 代码大模型 +Codebase 索引 " 的双重优势。一方面,码道融合了华为自研的代码大模型,能够精准理解代码的语义和逻辑,支持多种编程语言的自动生成、代码优化、bug 修复等功能,大幅提升代码编写的效率和质量 ; 另一方面,码道接入了企业的 Codebase 索引,能够全面掌握企业的代码体系、业务逻辑,让 AI 不仅能够写代码,还能懂业务,能够根据企业的业务需求,生成符合业务场景的高质量代码,避免了代码与业务脱节的问题。

同时,码道还适配鸿蒙、昇腾生态,能够为基于鸿蒙系统、昇腾芯片的智能体开发提供针对性的代码支持。数据显示,CodeArts 自 2 月公测以来,获得了市场的广泛认可。周跃峰透露,其用户量增长 7 倍,日活用户增长 12 倍。

可以说,码道的推出,不仅升级了企业的代码生产力,更重塑了智能体开发的全流程模式。传统模式下,智能体开发高度依赖大量专业研发人员,周期长、成本高、代码质量参差不齐 ; 而码道通过 AI 深度赋能,让代码生成、优化与修复变得更高效、更精准、更贴合业务逻辑,帮助企业把宝贵人力从重复繁琐的编码工作中解放出来,将更多精力聚焦于业务创新与价值创造。

写在最后

Token 流量的爆发式增长,为产业带来前所未有的时代红利,也让企业直面算力成本高、开发门槛高、落地难度高的三重挑战。华为云以 FlexNPU 柔性算力破解 " 用不起 ",以 AgentArts 智能体平台破解 " 造不出 ",以码道 CodeArts 破解 " 用不好 ",三大引擎层层递进、环环相扣,共同构筑起从算力供给、开发构建到长期迭代的全链路智能体落地体系。

正如周跃峰所言:"AI 要健康地发展,不成为泡沫,一定要能够成为提升企业生产力的工具,而不仅仅是提供情绪价值。" 华为云的这场战略跃迁,本质上是在引领 AI 技术走向真正的商业回报。对于所有渴望抓住 AI 时代机遇的企业和开发者来说,选择与华为云同行,或许就意味着选择了一条将 AI 从宏大构想付诸现实的可行路径。

当 AI 的喧嚣褪去,真正的价值沉淀才刚刚开始。相信随着华为云各项战略的持续落地,以及更多伙伴的加入,这片 " 黑土地 " 必将孕育出更多可落地、可创造、可复制的 AI 成果,让智能体真正走进千行百业,成为驱动企业降本增效、数智转型的重要力量。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 华为云 龙虾 ceo
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论