天翼云联手鲲鹏，为企业Agent补上“长期记忆”的关键拼图

左右决定企业 AI 落地速度的，是能否把模型、算力、数据、工具、记忆、安全和成本统一起来。谁先拥抱 Runtime 、 Token 与 Data 协同的 AI 全栈云底座，谁就更有机会拿到 Agentic AI 时代的 " 船票 " 。

撰文｜张贺飞

编辑｜沈菲菲

过去两年，AI 产业的叙事中心一直围绕大模型展开：参数规模、训练效率、推理成本、模型能力边界。

可当 OpenClaw 代表的 Agent 落地到千行百业，越来越多的问题浮出水面：一个能够理解任务、调用工具、访问数据、编排流程、持续执行的智能体，需要的不仅是基础算力和模型，而是一套完整的运行体系。

问题在于，什么是适合 Agent 的运行体系呢？

5 月 22 日的 KADC2026 鲲鹏开发者峰会上，天翼云联合鲲鹏给出了清晰的答案——构建 Runtime、Token 与 Data 协同的 AI 全栈云底座。

- 01 -

底座重构，

企业AI正在从"调API"走向Agent Native

很多企业做 AI 应用，本质上是在 " 调接口 "：前端套一个聊天框，后端接一个大模型 API，再接几个业务插件。

这样的模式，曾是两年前的主流思路，但在 Agent 时代已经行不通。

因为企业业务不是单轮问答，常常是跨系统、跨角色、跨流程、跨权限的连续任务，一个真正可用的 Agent，既要能理解任务，也要能调用 ERP、OA、CRM、知识库、浏览器、代码环境等工具。折射到企业的 IT 架构上，AI 不能停留在 " 外挂能力 " 的阶段，必须变成云原生架构中的一层运行时。

天翼云公有云事业部研发专家周望在演讲中提到，天翼公有云当前的 AI 全栈产品体系被划分为三个模块。

第一个是 Agent Infra，提供 Agent Runtime、Agent 沙箱、流程模式、中间件、Serverless 底座等核心运行能力。可以理解为智能体运行的 " 水电煤 "，解决了任务怎么拆解、工具怎么调用、状态怎么保存、异常怎么回滚、权限怎么隔离、多个 Agent 之间怎么协同等应用和运行问题。

第二个是 AI Infra，包含异构算力池化调度、推理加速、密态计算、智算网络等算力与引擎能力。简单来说，就是为 Agent 提供稳定、高效、低成本的 " 动力系统 "，解决的是怎么让每一个 Token 生成得更快、更便宜、更安全，怎么让每一个 Agent 任务跑得更稳、更流畅、更可持续。

第三个是 Data Infra，涵盖向量存储、极速缓存、可信数据空间等数据服务。Agent 执行任务的过程中，需要持续调用企业内部的知识库、业务数据、历史记录和外部信息，Data Infra 的价值正是让 Agent 在执行任务时能够快速检索、精准调用、稳定读写，并且保证数据安全和权限可控。

三个模块实现了上层应用到底层算力的全覆盖，同时也揭示了 Agent 时代的生存法则：影响智能体能否落地的因素，不只是模型本身，关系到运行、数据、安全与成本控制在内的全套能力。

企业需要的不是一个个孤立的 Agent 应用，而是一个能够承载智能体开发、部署、运行、治理和运营的统一底座，企业的 AI 基础设施正在从 "Model Native" 走向 "Agent Native"。

在 Model Native 的架构下，主要提供算力、模型训练、推理接口、API 调用，目标是让企业 " 用上大模型 "；而 Agent Native 架构的要求，进一步升维到智能体运行所需的能力，需要原生融入云基础设施中，涉及任务编排、工具调用、上下文管理、长期记忆、权限隔离、数据访问……不再是应用层临时拼接出来的功能，而是 AI 基础设施的标准能力。

就像天翼云所示范的：Agent Infra 解决运行框架，AI Infra 解决推理效率，Data Infra 解决数据支撑，三者合在一起，才让 Agent 从一个 " 会对话的应用 "，变成了适合千行百业的生产力引擎。

- 02 -

跨越瓶颈，

软硬协同攻克"失忆症"与"成本陷阱"

Agent 进入企业的生产环境后，摆在案头的是一个更加棘手的问题：一份份近乎 " 天价 " 的算力账单。

和 AI 进行对话时，每次只需要完成一次回答，但企业 Agent 要处理长任务、多轮交互、多工具调用、多步骤规划。一旦任务链条变长，问题就会集中爆发，其中被诟病最多的瓶颈有两个：

一个是 " 失忆症 "，由于初期任务信息易丢失、缺少全局最优规划、缺乏自我修正机制等，导致长序列任务准确度较低。

另一个是 " 成本陷阱 "，因为历史上下文不可压缩、失败重试与冗余路径增加等原因，Token 消耗随对话轮次指数级膨胀。

面对横亘在千行百业面前的难题，天翼云和鲲鹏的合作没有止步于算力：天翼云自研的智能体应用 AgentDesk 与鲲鹏智能体记忆系统进行了协同增强，用软硬协同方式消除了 Agent 长任务场景的系统瓶颈。

核心思路是引入鲲鹏 oG-Memory 管理框架，通过记忆压缩、上下文缓存、精细提取、按需渐进加载、历史会话摘要、记忆共享 / 隔离等能力，以及 openGauss 的向量存储，鲲鹏的检索加速、Embedding CPU 加速、存储加速等能力，在保留关键记忆的同时，降低推理过程中的 Token 开销。

以 LoCoMo 长序列任务测试为例，AgentDesk+ 鲲鹏智能体记忆系统组合交出了一份实打实的高分答卷：在长序列任务中的准确度达到 90.8%，较原生 OpenClaw 提升了 37%，较 AgentDesk 提升了 36%；输入 Token 消耗仅 236 万，比原生 OpenClaw 降低了 68%，比 AgentDesk 降低了 30%。

隐藏在数字背后的，是软硬协同的融合创新范式。

不少 Agent 框架处理长期任务，采用的是 " 堆上下文 " 的方式。结果就是，任务越长，塞进去的历史越多，Token 成本越高，模型注意力越分散。看似记忆比较完整，实际效率随着对话轮次越来越低。

天翼云和鲲鹏的实践，没有简单地把历史对话塞回上下文，而是把记忆从上下文窗口里 " 拆出来 "，变成一套可检索、可压缩、可分层、可隔离、可加速的数据基础设施。在 Agent 执行任务的过程中，模型不需要每次吞下全部历史对话，可以在需要时按需加载关键记忆。

把视角再放大一些，天翼云和鲲鹏明确了一个方向：Agent 的能力边界，不只由模型决定，Runtime、Memory 与算力基础设施的协同，将是 AI 从对话机器人走向数字员工的分水岭。

不只是长期记忆系统，在 Agent 的安全治理方面，天翼云和鲲鹏有着相同的原则——"让AI在边界内行动"。

天翼云的智能体引擎 AGE 打造了浏览器、代码、手机等沙箱系统，鲲鹏超节点的沙箱系统进一步实现了快速启动、高密部署和快速回滚，正在以双向奔赴的形式让 Agent 既能高效、准确、低成本执行任务，且始终被限制在可隔离、可回滚、可审计的安全边界内。

- 03 -

写在最后

智能体时代的 AI 基础设施，将从 " 应用中心 " 转向 "Agent 中心 "，从 " 模型接入 " 转向 " 运行体系 "，从 " 单点智能 " 转向 " 全栈协同 "。

大模型并没有消失，而是退到了幕后，成为 AI 计算底座中的一项基础能力。左右决定企业 AI 落地速度的，是能否把模型、算力、数据、工具、记忆、安全和成本统一起来。谁先拥抱 Runtime、Token 与 Data 协同的 AI 全栈云底座，谁就更有机会拿到 Agentic AI 时代的 " 船票 "。

推荐阅读

《华为的 AI+ 制造答卷》

《数据才是具身智能的 " 生死线 "》

《新华三定义 AI 基础设施的系统级进化》

《硅谷在 " 造墙 "，中国在 " 修路 "》

点 "推荐 "，变好看哦。

宙世代

一起剪

相关标签