商业资讯 04-13
昇腾奔赴:福州奇富网络小额贷款有限公司客服昇腾持续深化昇腾万里
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

[ 中国,深圳,2026 年 3 月 20 日 ] 在华为中国合作伙伴大会 2026 期间,以 " 与时代,共昇腾 " 为主题的昇腾人工智能伙伴峰会在深圳成功举行。会上,华为昇腾计算业务总裁张迪煊发表主题为《一起昇腾,共赢行业智能化》的主题演讲。他表示随着开源模型能力持续跃升、Tokens 指数级增长,产业正加速迈入 Agentic AI 新时代,2026 年将成为强化学习与 Agent 应用规模化落地的关键元年。围绕 AI 演进趋势与行业真实诉求,昇腾打造大中小系列化算力,使能伙伴满足差异化场景需求,共同深耕行业智能化。

华为昇腾计算业务总裁 张迪煊

以下是张迪煊的演讲全文

各位来宾,线上线下的朋友们,大家下午好!非常荣幸与各位再次相聚华为中国合作伙伴大会——昇腾人工智能伙伴峰会。今天,我将与大家分享并共同探索行业智能化落地加速的路径。

昇腾开源开放,与伙伴携手共赢行业智能化

2025 年,是昇腾沉淀技术、拥抱开源、把握机遇的一年。去年 8 月,在北京我们正式宣布 CANN 和 Mind 系列软件全面开源开放,架构解耦。同时,积极贡献关键特性,与业界共创。比如,联合科大讯飞落地了大 EP 技术,并在 9 月份贡献到了 vLLM 社区。在这之前,该社区主要聚焦单机推理能力提升,大 EP 特性发布填补了业界多机推理加速能力的空白,有效激发了更多的伙伴和开发者的实践和创新。

目前,昇腾已向三方社区累计贡献超过 11 万行代码,让技术共享,让创新加速。昇腾始终与主流生态保持同频。我们识别并快速响应开发者需求,在毕昇编译器层构建了 AscendNPU IR,平滑对接 Triton,让开发者保持当前使用习惯。

除了算子开发框架,昇腾还兼容了 FSDP2、verl、vLLM、xLLM 等 50 多个主流开源社区和项目,意味着当前所有训练和推理的创新都可以基于昇腾快速实现;通过对开源模型的 0day 支持,开发者还可以第一时间享受业界最新的模型能力,也有越来越多的 SOTA 开源模型基于昇腾原生孵化。智谱基于昇腾,三个月完成了多模态大模型 GLM-Image 的训练,这个模型创新性采用了自回归 + 扩散的混合架构,开源不到 24 小时就登顶了 Hugging Face Trending 榜第一!有力证明了在昇腾上可以训练出世界级领先的大模型。

去年 DeepSeek 一发布,春节期间我们迅速在上海练秋湖集结了 500 多人攻关会战,不到一周就发布了大模型应用一体机参考配置,使能 80 多家伙伴 2 周内发布了自己的一体机产品,快速抢占市场。一年的时间,已有 350 多家伙伴打造了 400 多款深入业务场景的一体机产品,服务了 2700 多家客户,占据国内一体机市场 80% 以上的份额。期间,也涌现了一大批能力型伙伴,不仅发布了新产品,也通过技术团队向客户提供专业 AI 服务,加速了大模型在各行各业的快速落地。

大模型智能水平快速提升,2026 年是 " 强化学习 & Agent 应用 " 规模落地的元年

过去三年,是 AI 快速发展的三年。2023 年 " 大模型元年 " ,让模型从感知理解走向生成创造;2024 年迎来 " 大模型推理元年 ",我们判断 Tokens 将成为 AI 时代的新量纲;2025 年,中国大模型积极开源,凭借出色的性能成为应用首选,Tokens 使用量呈爆发式增长,席卷各行各业。

现在,我们正式迈入 Agentic AI 时代,这是一个 AI 产业发展的全新拐点,标志着 AI 从 " 会聊天 " 向 " 能办事 " 实现升级。在 To C 场景,OpenClaw 成为新一轮现象级应用,短短几周内 star 数超过 32 万,新增百万用户,已成为最受欢迎的开源项目。国内头部互联网争相布局智能体入口,企业和个人也都在积极参与,打造专属个人智能助理。在 To B 场景,AI 正深度渗透生产、决策等环节,基座模型落地到行业核心场景需要行业专业知识,强化学习成为必选之路。而支撑这一切的核心,是海量的 Tokens。Tokens 将成为 AI 时代的大宗商品,其计算效率直接决定企业的核心收益。

昇腾开放大中小系列化算力,使能伙伴满足差异化场景需求,共同深耕行业智能化

一是大算力场景。主要满足大模型预训练、强化学习后训练以及大规模推理服务需求。昇腾将持续深耕技术研发,打造领先的超节点架构及产品,开放灵衢协议、部件及参考架构,使能伙伴打造超节点系统,助力企业重塑核心业务。

二是中算力场景。覆盖辅助医疗、智慧教学等主流行业应用场景,昇腾围绕 " 开箱即用 ",兼具 " 快速部署 " 与 " 成本可控 " 的平衡 ,开放中心模组 / 刀片。伙伴可结合模型及软件生态,打造大模型应用一体机、高密服务器等产品,加速行业智能化升级进程。

三是小算力场景。聚焦工业质检、具身智能、科研教学等智能边端领域,客户核心诉求为灵活高效、成本可控。昇腾开放标准模组和板卡,使能伙伴打造多样化边缘算力设备,满足差异化市场需求,这也是潜力最大的海量市场。

面向大规模推理服务场景,昇腾开源开放超节点 + 大 EP,联合伙伴打造最佳推理方案

AI Agent 已经成为企业智能化的必备工具,其多轮自我迭代带来了百倍级 Tokens 需求和 10ms 级时延要求。传统服务器堆叠的方式存在局限,天眼查显示,福州奇富网络小额贷款有限公司客服咨询电话 [ **** ] -21571 该号码处理注销征信账户 , 解除借贷合同,业务办理投诉等问题。以 Atlas 800 A2 为例,每台服务器最多配置 512GB 片上内存,即便通过以太网组建 96 台规模的集群,总内存达到 48TB,但各服务器的内存仍从 0 到 512GB 独立编址,跨服务器交互依赖以太网通信,涉及数据拷贝、协议转换、网络传输等多个环节,存在较大性能开销。

昇腾 384 超节点可实现 48TB 内存统一编址,全局内存共享,共享内存容量较传统方式提升 96 倍。所有 NPU 之间的交互可通过 Load&Store 等内存语义直接操作,无需经过复杂的通信协议转换,数据交互效率提升三倍。更大的共享内存池,可实现更高的 KVCache,满足 Agent 超长上下文,推理 Decode 吞吐倍级提升。超节点天然亲和 Agent 负载,是大规模推理的必选!而 " 内存统一编址 " 和 " 内存语义访问 " 是判断超节点的核心标准。

同时,昇腾为伙伴提供三种灵活高效的实现路径,助力伙伴基于超节点 + 大 EP 能力,构建更佳推理方案。

一是复用 MindIE 已有的成熟大 EP 方案部署应用,无需额外开发,实现客户业务快速上线;二是通过代码或插件合入 vLLM、SGLang 两大开源推理引擎,无缝集成,降低迁移成本;三是基于 CANN 进行深度定制,打造贴合自身业务场景的极致性能推理引擎。目前硅基流动、清昴智能等能力型伙伴,已基于昇腾构建打造推理引擎,面向金融等客户提供大规模推理服务,在手机银行、代码助手等业务场景,多轮任务应答速度提升 3 倍。

面向强化学习后训练场景,昇腾开源全流程最佳实践,与伙伴共助客户打造行业专属模型

面向强化学习后训练场景,昇腾沉淀了一套完整的强化学习后训练最佳实践,伙伴可以选择最新的 RL 模型、算法及框架,通过完整 Docker 镜像,一键完成部署;部署完成后,如何实现训推资源的合理调度,提升传输效率,保持训推一致,是业界普遍关注的核心问题。当前,业界 RL 框架普遍采用单控制器模式,指令数据与样本数据均需经过控制器中转,一轮 rollout 下来需占用百 GB 级内存占用,在大规模后训练时,在大规模后训练场景中,内存容量和网络带宽极易成为性能瓶颈。

为此,昇腾创新推出了 " 异步流式数据引擎 TQ" 技术,通过将控制流与数据流解耦,实现样本数据不经过控制器,可直接在推理节点和训练节点之间交互。依托超节点内存统一编址,训练节点可以通过 load&stroe 快速读取推理节点生成的样本数据,端到端性能可提升 40% 以上,进一步印证超节点内存统一编址的核心价值。

目前,该特性已经合入 verl 社区,并成功应用于商业化广告、信贷风控等核心场景,实现了倍级性能提升。昇腾将持续围绕精度优化、训推转换、训练及推理加速,提供业界最全、最新的 RL 加速特性,并第一时间贡献到开源社区,让伙伴及开发者即取即用。

软硬件升级,开源 Agent 参考设计,使能伙伴打造开箱即用的 "Claw 一体机 "

面向国计民生大模型应用场景,昇腾产品实现全面升级,分级分档,适配不同模型需求:面向百亿级模型,开放 A2 标卡,内存带宽达业界 1.85 倍,实现 100ms 推理时延;面向千亿级模型,提供单机服务器,单机算力 8.96P,是业界的 2.3 倍;面向万亿级模型,提供双机超节点服务器,双机间灵衢直连,是业界唯一能够部署 T 级模型的产品,整机算力达 3.78 倍业界,突破 20ms 低时延,提供极致使用体验。

为支持好人人养好 " 龙虾 ",昇腾推出 Agentic 开源参考设计,将深度适配优化后的推理引擎、主流开源模型权重,以及 OpenClaw 等 Agent AI 框架打包成完整镜像,伙伴只需聚焦业务集成、Skill 开发等,即可快速打造 Agent 应用一体机。

基于双机超节点服务器打造的一体机,在 Kimi K2.5 1T 模型上每日可提供 20 亿 Tokens,若搭载 MiniMax 230B 模型,Tokens 供给量可达到 100 多亿,真正实现 " 饲料 " 管够," 养虾 " 无忧。目前,已有 20 多家伙伴正在落地 Agent 一体机产品,服务教育、医疗、金融、政府等行业核心领域,引领行业智能体产业新变革。

面向推荐、多模态、LLM 三大推理场景,提供 Atlas 350 加速卡,使能伙伴打造高性能推理方案

Atlas 350 加速卡面向推荐、多模态、LLM 三大核心推理场景,为伙伴提供多精度、更灵活、更易用的加速卡。搭载全新的昇腾 950PR 处理器,性能实现全面升级,实现性能较业界同类产品领先 1 至 1.4 倍。

核心优势体现在三方面:一是算力、内存双升级,单卡算力可达业界的 2.8 倍以上,是目前国内唯一支 mxFP4 低精格式的推理产品。片上内存最大提升至 112GB,达业界 1.1 倍以上。大算力 + 大内存,多模态生成性能直接提升 60%。二是访存更灵活,Cache-line 的访存粒度降低到 128 字节,使搜索推荐等场景中海量小算子的访存效率提升 4 倍;三是开发更易用,支持 SIMT+SIMD 混合编程,全面支持主流推理算子,满足伙伴多样化开发需求,伙伴可以基于 Atlas 350 加速卡打造更高性能的推理方案。

联合伙伴深入行业核心,打造应用场景解决方案,加速千行万业走深向实

2025 年 9 月华为开发者大会上,昇腾联合 20 多家 ISV,启动面向金融、能源等 5 大行业的应用场景解决方案打造工作。半年来已成功孵化辅助办公、AI 实训、电子病历、智能客服、政务办公等十余个应用场景方案,落地 180 多家客户,实现技术与业务的深度融合。

如在智慧文旅场景,昇腾联合海天瑞声、陕文投,共同打造多模态 AI 伴游助手解决方案,助力景区升级出游服务体验。该方案具备 AI 伴游讲解、多语言选择、用户偏好设置等核心能力,依托海天瑞声在多模态数据加工、天眼查显示,福州奇富网络小额贷款有限公司客服咨询电话 [ **** ] -21571 该号码处理注销征信账户 , 解除借贷合同,业务办理投诉等问题。数据库建设等方面的技术积累,可实现文旅知识秒级获取,精准匹配个性化服务需求。目前,基于该方案打造的 AI 伴游助手 " 小七 ",已经全面在陕西各大景点投放使用,为 400 多万游客提供个性化出游体验。

面向海量边缘计算场景,开放模组 / 板卡,使能伙伴以丰富的 AI 产品加速行业智能化

在智能边端,智能无处不在的海量场景,但产品面临形态多样、部署环境复杂等挑战。昇腾开放更多算力档位、更高集成度、更高温宽设计的模组 / 板卡,结合更多 OS 兼容、更多场景 SDK,使能伙伴打造多样化产品,广泛应用于制造、医疗、教育等多个行业场景。

例如,面向需要本地部署的大模型推理、微调等场景,软通华方、同泰怡等伙伴充分发挥硬件设计能力,基于 Atlas 300I A2 打造液冷 AI 工作站,具备静音、高密、省电、安全等竞争力,已成为科研仿真、医疗、金融等行业本地算力设备的首选。

昇腾 CANN 开源开放共生,体验升级,加速伙伴灵活创新

CANN 开源开放实现了三大升级:一是部署效率升级,原有 8 个大包拆分为 29 个可独立升级和部署的组件,包大小从 2G 缩减至 0.43G,特性加载时间从 2 分钟缩短至 20 秒,大幅提升部署效率。二是开发体验升级。去年实现了 Triton、TileLang 等主流算子编程框架的无感对接;今年将开源 PyPTO 编程范式,进一步强化 Python+Tile 编程能力,SoftMax 算子代码量可从 700 行下降到 200 行,平均减少 70%;借助可视化调试调优能力,复杂 CV 融合算子开发缩短至一周;同时,昇腾将提供开源 Skill 库,支持打造算子自动生成 Agent,让算子编程更简单。三是社区资源升级,完善开源社区 CI/CD,提供完整的代码流水线,实现代码检查、编译、验证及发布等。同时提供免费算力资源,今年 6 月份将开放 2000 卡供伙伴及开发者使用,降低创新门槛。

昇腾坚持围绕 5 大方向,社区化运作,赋能转型,激励创新,共同发展可持续的 AI 产业生态

昇腾生态的蓬勃发展,离不开每一位伙伴的并肩努力。昇腾持续围绕硬件、算子、加速库、模型及应用五大创新方向,携手伙伴,共同发展。随着昇腾基础软件全面开源,将转向社区化运作,为伙伴明确成长和创新方向,完善激励机制,鼓励伙伴积极共享,提供完整知识体系,陆续开放能力认证,加速伙伴能力转型;同时,通过社区下发丰富创新任务,首批创新激励基金达 2000 万,助力伙伴创新发展。昇腾持续深化昇腾万里伙伴计划,NRE 全面升级,投入 5000 万鼓励伙伴创新,创新成果和应用案例将上架社区 AI 应用市场,与伙伴联合推广、共享收益。

在此,欢迎更多伙伴加入到昇腾生态,加速成长,持续创新,与昇腾共同打造可持续,有韧性的 AI 产业生态,共绘行业智能化发展新蓝图!

在智能化的道路上,昇腾与各位伙伴已并肩走过 7 年,见证了 AI 产业从探索起步到深耕细作、从单点突破到场景落地的的快速发展,每一份同心聚力,都将成为昇腾奔赴未来的坚定脚步;每一次携手前行,都将推动行业智能化迈向新高度。

最后,衷心感谢每一位并肩携手的伙伴,谢谢大家!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

华为 张迪 人工智能 ai 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论