未尽研究 05-21
平头哥一年一迭代,阿里攻坚智能体算力自由
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

过去,阿里云的客户是 B 端的企业与 C 端的消费者;未来,它的客户将是 A 端的智能体(Agent)。

新客户意味着新市场。在 AI MaaS 已经位居中国第一的基础上,阿里云正在进入一个不再以企业 IT 支出为上限,而是以企业整体生产活动为边界的智能体经济。而客户结构的变化与商业模式的升级,开始要求阿里云进行一次全栈重构。

这是一个海量智能体长期在线的市场。与人类用户受限眼睛的阅读速度与大脑的处理速度不同,智能体的交互延迟越低,就越能创造更大的价值。这尤其需要在芯片与算力基础设施层面加速迭代、协同创新,解放它的生产力。

在新近发布的 Omdia 的报告中,阿里云在中国的 AI IaaS 和 MaaS-MPS 两大子市场均位列第一,截至 2025 年的总份额,上涨至 38.1%。其中,在 MaaS 市场中,MPS(Model Production Service)模式占比约 75%,而阿里的份额约为 42%,居于首位。

云计算正在从资源租赁业务,真正升级为企业生产系统的一部分。如果说,IaaS 是 GPU、储存、网络的租赁,MaaS 是模型能力的服务化,那么,MPS 则是模型进入生产系统后的组织方式。与以 API 调用为典型的 MCS 模式(Model Consumption Service)不同,MPS 面向模型的生产,更接近大模型与智能体在嵌入现实工作流的过程中,需要面对与解决的工程挑战与开发现状。

阿里云现在管理与运营的,不是规模化的资源,而是规模化的智能。在 AI 时代,要让全天下没有难做的生意,首先就要让工作没有难用的智能体。在这个意义上,就能理解阿里云为何要在昨日的峰会上,一口气 " 重置 " 了自己的芯片、模型、云、智能体与应用。

对于智能体而言,交互速度就是价值本身。这意味着包括 AI 芯片在内的整个算力基础设施因此而改变。

在峰会上,新一代训推一体 AI 芯片真武 M890 正式亮相。该芯片配备 144GB 的显存容量与 800GB/s 的互联带宽,达到了英伟达 H200 水平;它的性能是上一代真武 810E 的 3 倍,而后者此前被市场视为大致对标 H20;与此同时,它原生支持低精度的 FP4,跟上了 Blackwell 架构的节奏,大幅降低了智能体长程运行带来的 KV 缓存。

同期发布的,还有自研互联芯片 ICN Switch 1.0,支持将 128 张芯片纵向扩展(Scale up)为单一计算单元,P2P(点对点直接通信)时延低于 150ns,主打解决智能体场景下的海量并发推理和大模型训练需求。

事实上,平头哥的芯片全家福,还包括倚天系列 CPU、磐脉智能网卡、镇岳存储主控芯片。这只比今年 GTC 上黄仁勋一下子拿出 7 款芯片少量两款。在智能体的任务编排越来越倚重 CPU 的复兴,以及智能体介入工作流频繁读取 " 记忆 " 的趋势下,芯片层面的垂直自研与协同,将大幅提升 token 吞吐的效率与性价比;谷歌 TPU 与 Gemini 的组合,已经证明了这一点。

技术路线的确定,以及规模场景的验证,还推动平头哥以一年一代的节奏,迭代真武系列 AI 芯片,以更及时地适配模型与响应行业需求。平头哥还在推动全自研的软件栈 T-head SAIL,先从兼容主流框架和算子做起,但随着开源模型持续渗透市场,真武芯片商业化扩展,未来市场上不少模型、智能体与应用,都将深度融入平头哥。

阿里正在让模型 " 从对齐人类偏好,到对齐任务目标 "。这意味着模型优化目标从回答得像人,转向把事情做完。这次发布的千问旗舰模型 Qwen3.7-Max,面向 Agent 全新设计,甚至已经能够从零开始自主工作 35 小时,自主规划与长程运行,这恰恰是 Agent 场景最核心的两大需求。

整个公共云正在被改造成 Agent 原生操作环境。在峰会上,阿里云 CTO 李飞飞履新后首秀,不仅针对 " 无规律弹性、短生命周期、瞬时起量即走 " 的智能体工作负载,重构出 Agent Native 的云产品,还将旗下不同云产品进行了 Skill 化、MCP 化和 CLI 化改造,让它们都变成 Agent 可以 " 像调函数一样调用 " 的标准化能力模块。

为了服务智能体客户,阿里云上线了为 Agent 而生的官网 " 千问云 ",用户仅需一句指令,OpenClaw 这样的智能体,就能 " 学会 " 这个网站上的全部能力,根据需求一键调用。

既然智能体将是市场的主要参与者,那么,如何保障智能体的身份、安全与隐私问题,是平台无法回避的技术细节。谷歌与苹果的私有 AI 计算,实现了隐私保护端到端,正在成为行业的标配。

在峰会上,阿里云声称,平台上的每个 Agent 都拥有独立的身份认证、权限边界、行为审计;而不同企业之间的工作流与数据流,将通过硬件级别的隔离,在物理上彻底隔开;CMaaS 机密推理,让推理服务与传输链路可信而不可见。

这一套技术的全栈重构,是在算力之上叠加模型能力、工具调用和业务流程,直接参与客户的生产过程。客户粘性强于直接 API 调用。而且,这也有助于最终将整套业务逻辑,内化于模型与执行环境的迭代之中。

在阿里云智能集团资深副总裁、公共云事业部总裁刘伟光看来,视频生成的 token 消耗,和 AI 智能体的 token 消耗,并不能简单等价。前者固然是一个迅速增长的垂直市场,而后者则更意味着通用的生产力的提升,对应着 " 千行百业 ",也即市场本身。阿里巴巴更看重后者。这也是 MaaS 市场真正扩展之处。

作为进入更广阔的智能体经济的引导程序,AI 编程正在为 MaaS 服务创造新的可获得市场(TAM)。人类程序员无法穷尽学会所有编程语言,也无法在疲劳状态下工作;AI 将激活 COBOL 等几十年前写的、没人敢碰的核心老系统,自动重译成能在云上弹性运行的新应用;每个用户都能轻量级地编程完成一个繁琐任务,而更职业的专业人士则由此解锁了新的交叉领域。

过去,云厂商的市场规模大致等于企业 IT 支出乘以云化率,现在,云化率要乘以所有被 AI 智能体覆盖的经济活动总量。在年初至今的 5 个月内,阿里云 MaaS 平台日均 token 收入,已经实现了 15 倍的增长。阿里云的全栈重构,或许只是一个开始。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里云 芯片 阿里 基础设施 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论