智东西 22小时前
阿里李飞飞首秀:一口气面向Agent发了32个新品
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 李水青

编辑 | 漠影

2026 阿里云峰会,可能是阿里云成立 17 年来释放信号最为密集的一场发布会。

智东西 5 月 20 日杭州报道,今天,阿里云宣布完成 " 芯片 - 云 - 模型 - 推理 " 全栈 Agent 化升级,同步推出搭载自研 AI 芯片真武 M890 的超节点服务器、最新旗舰模型 Qwen3.7-Max、全新 AI 产品 " 千问云 " 等超 50 项新品及升级。这是国内云厂商首次围绕 Agent 进行全栈产品发布。

"Agent 突破临界点之后,可以 24 小时不间断工作,对 AI 和云的需求无穷无尽。" 阿里云资深副总裁刘伟光说," 阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的 AI 工厂。"

放眼全球,云巨头们正在展开一场全栈 AI 竞赛。谷歌有 TPU+Gemini+GCP,亚马逊有 Trainium+Nova+AWS,而阿里云此次亮出的 " 芯 - 云 - 模型 - 推理 " 全栈体系被业内称为阿里 " 通云哥 ":通义 + 阿里云 + 平头哥。主要发布内容如下:

1. 平头哥首发新一代训推一体 AI 芯片真武 M890,性能为上一代 3 倍,并公布未来两年路线图;磐久 AL128 超节点服务器实现 128 卡互联,P2P 时延低于 150ns。

2. 阿里云全面迈入 Agentic Cloud,发布了至少 32 项 Agentic Cloud 新品及更新,覆盖运行时、编排、治理、安全、记忆、数据平面六大能力;对云产品进行 Skill 化、MCP 化和 CLI 化改造,让 Agent 像调函数一样调用云能力。

3. Qwen3.7-Max 正式发布,模型登顶 Arena 国产第一,可在全新芯片上自主工作 35 小时,将内核性能提升 10 倍。(智东西实测→《阿里 Qwen3.7 竞技场杀至国产第一!一手实测:分分钟破解奥赛难题,图文视觉全都难不倒》)

4. 百炼平台开放并池调度、上下文缓存等弹性技术,接入智谱、MiniMax、Kimi 等 150 多款模型。

5. 千问云官网(www.qianwenai.com)上线,以一行指令替代传统导航,全面 Skill/CLI 化,对 Agent 更友好。

一、李飞飞首秀:连发 32 大新品及更新

这是阿里云首席技术官李飞飞自 4 月 8 日就任后在峰会上的重要首秀。

李飞飞宣布,阿里云通过 Agent Infrastructure 为 Agent 负载提供支持,并推出 Agentic Products ——面向 Agent 的云产品。

Agentic 时代,云业务面临短生命周期、数据模态与存储形式复杂、无规律突发负载、动态环境依赖、任务级安全管控和大规模动态编排六大挑战,而 Agent Infrastructure 以运行时、编排、治理、安全、记忆、数据平面六大能力来应对挑战:

具体到运行环境,阿里云为 Agent 构建了完整的支撑体系:轻量高效的沙箱执行环境、多 Agent 协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。

Agentic Cloud 运行时五大新品及更新如下:

Agentic Cloud 编排一大新品及更新如下:

Agentic Cloud 治理四大新品及更新如下:

Agentic Cloud 安全五大新品及更新如下:

Agentic Cloud 记忆七大新品及更新如下:

Agentic Cloud 数据平面十大新品及更新:

阿里云 Agent Infrastructure 已助 MiniMax 企业级 Agent 大规模落地。

有了这些产品及更新,未来一个开发者只需要给 Agent 一句自然语言指令,Agent 就能自动完成从资源识别到应用部署的全流程,无需人工点击控制台或编写复杂脚本。

李飞飞认为,传统云产品的交互逻辑是为人设计的,用户看着控制台点击按钮,或者通过 API 编写代码调用。但 Agent 的工作负载是 " 无规律弹性、短生命周期、瞬时起量即走 ",与传统云计算的稳态负载截然不同。

传统云产品打开控制台,看到一堆菜单、配置项、仪表盘,这些视觉化信息对人很友好,但对 Agent 毫无意义。为此,阿里云对云产品进行了 Skill 化、MCP 化和 CLI 化改造,让每一个云产品都变成 Agent 可以 " 像调函数一样调用 " 的标准化能力模块。

阿里云不是在云上加一层 Agent 接口,而是把云本身变成 Agent 能用的东西。这套改造的野心在于让云从 " 人的工具 " 变成 "Agent 的操作系统 "。

二、平头哥首发真武 M890,扔出 128 卡超节点算力王炸

芯片层,阿里云亮出了一张目前国内云厂商中独一份的王牌:覆盖算力、网络、存储的完整自研数据中心芯片矩阵。

峰会现场,平头哥新一代训推一体 AI 芯片真武 M890 首次亮相。规格相当硬核:144GB 显存,片间互联带宽 800GB/s,性能是上一代真武 810E 的 3 倍。芯片原生支持 FP32 到 FP4 等多种数据精度,可应用于高精度训练到超低精度推理的全场景。在低精度推理场景下,不仅能保证模型输出质量,还能显著降低单次推理的算力开销。

更值得关注的是基于真武 M890 的磐久 AL128 超节点服务器,搭载自研互联芯片 ICN Switch 1.0。这个超节点可让 128 张 AI 芯片组成一台计算机,P2P 时延低于 150ns,单柜带宽达到 Pb/s 级。

为什么要做这么大的超节点?因为 Agentic 时代,算力集群需要承载成千上万个 Agent 同时运行,每个 Agent 在一次任务中可能连续发起数十次模型调用,对通信时延和带宽的要求是指数级上升的。该超节点已上线阿里云百炼,支持 Qwen、DeepSeek、Kimi 等主流模型。

平头哥还首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武 V900、真武 J900 两代芯片。目前真武系列 AI 芯片累计出货 56 万片,已服务中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。

加上自研的倚天系列 CPU、磐脉智能网卡、镇岳存储主控芯片、ICN Switch 互联芯片,平头哥的芯片版图已经从 " 单点突破 " 走到了 " 全面覆盖 "。

三、Qwen3.7-Max 来了,登顶 Arena 榜,胜任 35 小时长程任务

Qwen3.7-Max 是阿里巴巴最新发布的旗舰大模型。

在三方机构 Arena 全球大模型盲测总榜中,它超过 Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1,与 GPT、Claude、Gemini 最强模型接近,位列国产模型第一。在细分榜单上,数学排名第 7、专家任务第 9、编程任务第 10,表现相当均衡。

比跑分更有说服力的,是一个堪称 " 极限测试 " 的实战案例。在模型训练时从未接触过的全新硬件平台——平头哥真武 M890 芯片上,Qwen3.7-Max 仅凭一份任务说明,从零开始自主工作 35 小时,独立进行了 432 次内核评估、1158 次工具调用,完全自主地完成了编写、编译、性能分析与迭代改进的全流程。最终,它优化后的推理内核比 SGLang Triton 官方参考实现快了 10 倍。

没有人类干预,没有中间指导,35 小时,从零到生产级。测试轨迹还显示,模型在独立运行超过 30 小时后仍发现了有效优化点,甚至主动发起了一次关键的架构重设计。这个案例展示的不是模型 " 回答问题 " 的能力,而是模型 " 自主完成复杂工程任务 " 的能力——这恰恰是 Agent 场景最核心的需求。

阿里巴巴通义大模型事业部负责人周靖人谈道:" 大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max 的设计初衷,就是让模型真正成为 Agent 的智能内核,具备自主规划、持续迭代、跨工具协作的能力。"

值得注意的是,近 3 个月内,千问旗舰模型已经连续迭代了 3.5、3.6、3.7 三个版本,保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化,以匹配 Agent 时代对模型能力的指数级增长需求。

四、百炼平台全面开放,智谱、Minimax、Kimi 等顶尖模型首批上架

如果说芯片是地基、模型是引擎,那百炼推理平台就是 Agent 真正跑起来的 " 生产车间 "。

阿里云在百炼平台上构建了大规模 GPU 资源集群,并通过一套完整的技术栈应对 Agent 场景的特殊挑战:并池调度将 GPU 资源统一调度提升利用率;上下文缓存消除多轮对话和长链路任务中的重复计算开销;吞吐弹性调度应对并发请求的波峰波谷;Agentic RL 基于实际执行反馈让模型持续迭代。此外,百炼内建了安全治理能力——在 Agent 自主运行的语境下,一个 24 小时不间断执行任务的 Agent 如果没有边界约束,后果不可控。百炼的安全机制确保 Agent 始终在预设的权限范围内行动。

在生态策略上,百炼保持开放接入。峰会当天,阿里云宣布与月之暗面、Minimax、智谱、阶跃星辰、爱诗科技、生数科技等达成合作,GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、

Kling-v3-omni-video-generation、Vidu Q3-Pro 等模型已上架百炼,并通过千问云官网全面售卖。目前百炼已提供 150 多款主流模型 API。

百炼不仅提供阿里自研模型服务,同时面向头部 AI 厂商开放,为用户提供 " 一个入口、多模型可选 " 的一站式服务体验。目前百炼已推出按需、按时长的灵活计费模式,用户可通过统一 SDK 接口接入不同模型,实现灵活切换与高效迭代。据阿里最新财报,截至 2026 年 3 月,百炼平台该季度客户数量同比增长了 8 倍。

五、首发千问云,全面 Skill 和 CLI 化,对 Agent 更友好

千问云是阿里云成立 17 年来,首次在阿里云官网之外推出的全新产品官网。打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字:

安装 Skills npx skills add QianWen-AI/qianwen-ai

这是一条 Agent 可读的 prompt 指令。阿里云将所有模型服务的核心能力封装为标准化的 Skills 和 CLI 工具,智能体可以直接解析这条指令," 学会 " 网站的全部能力,并根据需求自主调用。

过去十年,云的交互逻辑是 " 人登录控制台→选产品→配参数→调 API"。这套流程对人类来说已经足够顺畅,但对 Agent 来说完全不可用。Agent 不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。

千问云 Skills 将模型选型、调用、认证配置、用量查询等完整链路能力封装,用户无需编写任何代码,Agent 即可动态路由不同模型——自动用视觉模型处理图片,用生图模型生成图片,用视频生成模型创作视频。千问云 CLI 则可覆盖登录认证、模型查询、调用、用量查询和环境诊断等能力,直接通过脚本或命令行自动化完成所有模型服务的工作流。

基于千问云 Skills 和 CLI,Agent 还能实时拉取模型用量数据,自动分析趋势、识别异常,为用户提供成本优化建议。目前,千问云 Skills 和 CLI 均已在 GitHub 开源。付费模式上,千问云提供按量付费和 Token Plan 订阅两种模式,后者适用于高频 AI 编程和 Agent 场景,可显著降低 Token 成本。

结语:全球云巨头展开 AI 全栈竞赛

当云的主要消费者从人变成 Agent,所有围绕人类设计的界面、流程和交互逻辑,都将被重写。

从芯片真武 M890,到 Agentic Cloud,到 Qwen3.7-Max,到百炼平台,再到千问云 …… 阿里云在 2026 年 5 月 20 日这一天,完成了一次从底层到入口的全链路重构。

放眼全球,这场竞赛刚刚进入深水区。谷歌以 TPU+Gemini+GCP 构筑闭环,亚马逊以 Trainium+Nova+AWS 正面迎战,微软手握 Maia+ Copilot+Azure。而阿里云此次亮出的 " 芯 - 云 - 模型 - 推理 " 全栈体系,证明了中国云厂商有能力在同一张牌桌上竞争。

吴泳铭在财报电话会上把 AI 投入比作建设 " 训练工厂 " 和 " 推理工厂 "。今天,这两座工厂已经开始全速运转。未来三年,阿里云的 AI 算力规模将比 2022 年增长十倍,是已经在执行的计划。

值得一提的是,阿里云选择了 " 开放 " 作为差异化路径——百炼平台接入 150 多款模型,千问云 Skills 和 CLI 全部开源,这既是生态策略,也是对 Agent 时代 " 没有一家模型能通吃一切 " 这一底层判断的回应。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里云 李飞飞 阿里 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论