星途科讯 05-22
参数增量仅0.12%,Delta-Mem重塑AI智能体长记忆机制
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 智能体正面临 " 遗忘 " 困境:代码助手调试时丢失线索、数据分析智能体重复处理上下文,导致团队不得不为高昂的 Token 成本、延迟及脆弱的工作流买单。主流解决方案如扩展上下文窗口或引入检索增强生成(RAG),不仅成本日益攀升,且在长期交互中效果难以保证。

针对这一痛点,Mind Lab 联合多所高校研究人员推出了 Delta-Mem 技术。该机制无需修改模型本体,而是将历史信息压缩为一个动态更新的矩阵。其显著优势在于轻量化:仅增加骨干模型 0.12% 的参数规模,远低于某主流替代方案高达 76.40% 的参数增量,同时在内存密集型基准测试中表现更优。Delta-Mem 使模型能够持续积累并复用历史数据,降低对大规模上下文窗口或复杂外部检索模块的依赖,从而维持行为连续性。

突破长记忆瓶颈

传统方案通常简单地将所有信息 " 倾倒 " 进模型的上下文窗口。然而,随着序列长度增加,标准注意力机制的计算成本呈二次方增长。即便理论支持百万级 Token,模型在面对大量且可能冲突的信息时,仍会出现 " 上下文腐烂 ",导致回忆效率低下。

现有记忆解决方案主要存在三类权衡:

文本记忆:受限于窗口大小,压缩易导致信息丢失。

通道外(RAG):增加延迟与集成复杂性,且可能与骨干模型产生对齐偏差。

参数化记忆:训练后静态固定,无法在实时交互中适应新信息。

Delta-Mem 旨在通过紧凑表示和动态维护,解决上述效率与连续性问题。

Delta-Mem 运作机制

Delta-Mem 将智能体的过往交互压缩为 " 在线关联记忆状态 "(OSAM),维护为一个固定大小的矩阵,同时保持底层语言模型冻结。在生成过程中,系统不检索原始文本,而是将当前隐藏状态投影到矩阵中,提取与上下文相关的记忆信号,并转化为数值修正量应用于模型计算。这种机制在不改变内部参数的情况下,引导模型推理。

每次交互后,系统通过 " 门控增量规则 " 更新在线状态。该机制包含控制旋钮,决定保留多少旧记忆及应用多少新记忆,通过基于差异的错误校正,使矩阵随时间演变,既保持历史关联稳定,又避免被短期噪声干扰。研究人员探索了三种更新策略:

Token 级写入:捕捉细粒度变化,但易受噪声影响。

序列级写入:平滑更新,牺牲部分局部细节以抗噪。

多级写入:将记忆分解为不同子状态,最小化信息干扰。

性能与效率双重提升

在 Qwen3-8B、Qwen3-4B-Instruct 和 SmolLM3-3B 三个骨干网络上的评估显示,Delta-Mem 全面超越基线。在 Qwen3-4B-Instruct 上,Token 级写入变体平均得分 51.66%,优于冻结原生模型(46.79%)及最强基线 Context2LoRA(44.90%)。在内存密集的 Memory Agent Bench 上,平均分从 29.54% 跃升至 38.85%;在测试时学习子任务上,性能几乎翻倍,从 26.14% 提升至 50.50%。

效率方面,Delta-Mem 仅增加 487 万个可训练参数。相比之下,MLP Memory 基线需 30 亿参数。当提示长度扩展至 32,000 Token 时,Delta-Mem 保持了与标准未修改模型几乎相同的 GPU 显存占用,避免了其他先进记忆系统的显存膨胀问题。

不同更新策略适配不同模型容量:序列级写入更适合 Qwen3-8B 等大模型,以平滑噪声;多级写入则显著推动 SmolLM3-3B 等小模型的性能飞跃。

企业落地与混合架构前景

目前,Delta-Mem 代码已在 GitHub 开源,训练适配器权重上线 Hugging Face。工程团队只需在现有指令微调骨干网络上附加适配器模块,并在域相关多轮数据上训练即可集成,无需庞大预训练语料库。

尽管效率显著,Delta-Mem 并非无损替代品,存在记忆混合风险。研究人员建议采用混合架构:Delta-Mem 作为轻量级内部工作记忆,处理用户风格或多步推理轨迹;RAG 则负责法律合同、医疗指南等需要精确引用和合规性的高容量显式记忆。

未来企业 AI 堆栈将趋向分层化:模型内部的短期工作记忆、检索系统中的长期显式记忆,以及决定存储、检索与遗忘策略的审计层将共同构成新一代智能体基础设施。

【来源:星途科讯】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 数据分析 效果 lab 轻量化
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论