集智俱乐部 昨天
当AI的键值记忆遇上大脑:原来我们和AI共享同一套记忆逻辑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

导语

在日常经验中,我们常把 " 遗忘 " 理解为信息的流失:时间久了,记忆就会慢慢消失;学习新知识,也可能覆盖旧内容。然而,从短视频推荐到大语言模型,再到人类被线索唤醒的记忆体验,这些现象或许指向另一种解释。这篇发表于 Neuron 的研究提出 " 键值记忆 " 框架,将记忆拆分为 " 索引 " 与 " 内容 " 两个部分:海马体负责提供检索线索,新皮层负责存储信息本身。在这一视角下,遗忘不再是内容消失,而更像是 " 找不到入口 " ——信息仍在,只是暂时无法被提取。这一跨越人工智能与脑科学的统一模型,不仅重塑了我们对记忆机制的理解,也为持续学习与智能系统设计提供了新的思路。

关键词:键值记忆(key – value memory)、海马体、新皮层、记忆检索、遗忘机制、Transformer、持续学习、认知神经科学

贾梓杏丨作者

张江丨审校

刷短视频时,平台似乎总能 " 刚好知道你想看什么 ";用 AI 写文案时,模型可以顺畅地接着你的思路往下生成;而当我们回忆童年趣事,一些零散的线索——一段旋律、一种气味——往往就能勾起完整的场景。

这些看似毫不相关的体验,其实都指向一个共同的问题:信息是如何被 " 存住 ",又是如何被 " 找回 " 的?

在人工智能中,一个常见的解释是键值记忆(key – value memory):系统通过线索定位信息,再提取对应内容。近年来,神经科学研究也提出类似视角。2025 年发表于   Neuron   的论文《Key-value memory in the brain》尝试用 " 索引—内容分工 " 来理解大脑:海马体更偏向提供检索线索,新皮层更多承担信息存储。

这并不意味着大脑就是一个简单的 " 键值系统 ",但这个框架提供了一种有启发性的统一视角,让我们重新审视一个熟悉却复杂的问题:记忆是如何被组织的,又为什么会 " 遗忘 "。

一、什么是键值记忆?AI 的 " 记忆秘诀 " 很简单

键值记忆听起来专业,实则逻辑我们每天都在用:手机通讯录里,姓名是 " 键 "(Key),电话号码是 " 值 "(Value),找姓名就能快速查号码——这就是它的核心:" 键 " 定位," 值 " 存储,分工明确。

AI 领域里,键值记忆早已是标配:ChatGPT 等大模型的 Transformer 架构、检索增强生成(RAG)技术,核心都是键值配对。它的优势,源于对传统记忆模型短板的突破。

传统自联想记忆(Auto-Associative Memory)(如图 1 左图所示),可以追溯到神经科学先驱约翰 · 霍普菲尔德在上世纪提出的 Hopfield 网络。在这个模型中,记忆以整体模式的形式被存储:只要给定一个不完整或带噪声的输入,网络就会自动 " 收敛 " 到最接近的完整记忆。这种机制就像把照片和名字写在同一张纸上——回忆时需要同时还原整个内容,因此一旦信息变多或彼此相似,就容易混淆或出错。

而键值记忆将 " 定位 " 和 " 存储 " 分开:" 键 " 只负责找位置," 值 " 只负责存内容,像书的目录(键)和正文(值),各司其职、互不干扰。以回忆过程为例,只需要给模型一个轻量的 Key,而不是一个全量的内容,就能实现 Key 到 Value 的查找。

键值记忆的流程只有两步,和查字典、找通讯录完全一致:

1. 写入记忆:将 " 键 " 和 " 值 " 绑定存入系统(比如记单词时,拼写是键、中文意思是值);

2. 读取记忆:用 " 查询线索 " 匹配键,提取对应的值(比如看到单词拼写,提取中文意思)。

图 1:自联想记忆与键值记忆的结构对比(作者绘制),前者通过整体模式匹配进行记忆恢复,后者将记忆拆分为 " 键 "(用于定位)与 " 值 "(用于存储),实现解耦检索。

神奇的是,Transformer、多层感知机(MLP)乃至人类大脑,都是这套流程的不同实现——这正是论文最核心的发现:人工与自然智能,记忆底层逻辑高度一致。

二、大脑的 " 键值分工 ":

海马体是 " 索引员 ",新皮层是 " 仓库管理员 "

人类大脑本身就是一套天然的键值记忆架构,论文通过大量实验,明确了两个核心脑区的分工:海马体负责 " 键 ",新皮层负责 " 值 "。

简单认识两个脑区:海马体是 " 记忆之门 ",体积小但关键,受损会导致无法形成新记忆;新皮层是 " 记忆仓库 ",占大脑大部分体积,存储常识、技能、感官体验等。

过去科学家只知两者分工不同,却不懂协同逻辑。直到 1995 年 O ’ Reilly 等人的工作 [ 1 ] 发表,人们才认识到:海马体不存具体内容,只编 " 索引 "(键);新皮层不负责定位,只存 " 内容 "(值)。

比如第一次去某一家特别的餐厅,海马体编码 " 键 " ——位置、装修、同行的人;新皮层存储 " 值 " ——味道、心情。后来看到相似装修(查询线索),海马体匹配键,从新皮层提取值,完整记忆就浮现了。

图 2:大脑中海马体和皮层的位置示意图,蓝色弯曲状的区域即为海马体图源 [ 1 ]

论文基于大量经典认知神经科学实验,建立了海马体编码键、新皮层存储值的分工框架。其中两组实验证据 [ 2 ] [ 3 ] 最直接、可重复性最强 :

实验 1:记忆并未消失,而是会随时间发生泛化,并可被线索重新精确化

为了检验记忆是在消失,还是在变得难以精确提取,研究者设计了经典的情境恐惧实验。大鼠在环境 A 中经历电击后,会形成情境特异性恐惧记忆。

在短期测试中,这种记忆表现得非常精确:大鼠能区分高度相似的环境 B 和完全不同的环境 C,只在 A 表现出明显恐惧反应。但随着时间推移,这种精确性下降——大鼠开始对相似环境 B 也产生恐惧反应,表现出明显的 " 记忆泛化 "。

关键发现是,这种变模糊的记忆并非真正丢失。当研究者只提供一个简单线索(例如将大鼠短暂带回环境 A 进行提示)后,大鼠对 A 与 B 的区分能力可以恢复,重新表现出对 A 的特异性恐惧反应。

这一结果表明:记忆内容本身仍然存在,只是随着时间推移,检索过程变得不稳定,导致提取结果变得泛化;而合适的线索可以重新激活原本精确的记忆,使其 " 从模糊回到清晰 "。

图 3:小鼠情境恐惧实验流程图 [ 4 ] 。大鼠在环境 A 形成恐惧记忆,短期内可区分相似环境 B 与不同环境 C,但随时间出现泛化;通过回到 A 进行提示后,记忆可重新恢复精确性。

实验 2:海马体通过拉开相似记忆的表征来减少混淆,实现索引分离

为了理解大脑如何区分高度相似的记忆,研究者让大鼠学习两条高度重叠的迷宫路线(约 80% 路径相同),并要求它们准确区分不同路线以获得食物奖励。

在学习初期,由于两条路线高度相似,大鼠容易混淆,对应的神经活动模式也彼此接近。随着学习深入,海马体中的表征逐渐发生变化:即使在重叠路段,两条路线的神经活动模式也被明显拉开,相似度持续下降。这种变化与行为表现直接相关——表征分离越明显,大鼠的区分准确率也越高。

相比之下,新皮层中的表征始终保持较高相似性,更稳定地反映路线本身的视觉与空间特征,并不会主动放大差异。

这说明,在面对相似记忆时,大脑并不是单纯依赖存储内容来区分,而是通过海马体提高不同记忆之间的区分度,减少检索时的相互干扰。相对而言,新皮层更专注于保持内容本身的稳定与完整。

从这个角度看,两者形成了一种分工:一侧负责把相似记忆区分开,另一侧负责把内容尽可能准确地保留下来。这种分工方式,与键值记忆中定位与存储分离的思路是相契合的。

三、我们到底为什么会 " 遗忘 "?

从键值记忆的视角来看,遗忘不再被简单理解为记忆内容的逐渐消失。相关研究(如 Berens et al. [ 4 ] 提出,记忆表现下降往往可以拆解为两个维度:能否被提取,以及提取是否精确。很多情况下,大脑记忆一旦存储,就长时间保存在新皮层,不会被擦除;遗忘本质是海马体的 " 键 " 失效,找不到索引,无法提取内容

这一观点与 " 键值记忆 " 框架形成了直接对应关系:如果将记忆内容视为 " 值 ",将检索线索视为 " 键 ",那么遗忘更可能发生在 " 键 " 失效或匹配困难的环节,而不是 " 值 " 本身被删除。在这一假说下,一个自然的问题是:这种 " 检索失败 " 是否能够在行为实验中被观察到。为此,研究者设计了两类经典实验。

第一类实验关注时间对记忆表现的影响。受试者需要记忆屏幕上目标出现的位置,并在不同时间间隔后进行回忆测试。结果显示:随着时间延长,能够成功回忆的人数下降,但只要能够回忆,他们报告坐标的精度与第一天毫无差别。这说明记忆内容(值)始终清晰,变弱的是海马体的索引能力(键)——时间久了,线索匹配效率下降,导致 " 搜不到 " 而非 " 记错了 "。

第二类实验则考察干扰的作用。受试者依次学习多组单词列表,并在最后回忆其中某一组。结果发现,被遗忘程度主要取决于该组内部信息的复杂度,而与后续学习内容的长度关系不大。这意味着遗忘并非 " 新记忆覆盖旧记忆 ",而是相似记忆的索引互相竞争、互相干扰,导致检索失败。

四:AI 的 " 遗忘 ",能被 " 唤醒 "

有趣的是,键值记忆框架也为理解 AI 的 " 灾难性遗忘 " 提供了新视角。

在传统机器学习的解释中,当模型先学习识别 " 猫 ",再学习识别 " 狗 " 时,""的知识被新任务"覆盖删除"。但在这篇论文所提出的框架下,可以从另一种角度理解这一过程:模型并非完全 " 忘记 " 了猫的知识,而是在参数空间中仍然保留相关信息的情况下,后续学习的表征在推理时占据了更强的激活优势,从而在检索阶段抑制了旧任务的输出。这与键值记忆中 " 内容仍在,但索引竞争导致无法顺利提取 " 的机制具有一定形式上的相似性。

这种视角也与人类记忆中的一些现象形成呼应。例如,在日常体验中,我们常常会出现 " 明明知道但一时想不起来 " 的情况。这类现象通常被解释为信息并未丢失,而是在提取过程中受到干扰或索引路径暂时失效。不过需要强调的是,人类记忆系统依赖海马体与新皮层的协同结构,而当前人工神经网络是单一参数系统,两者在实现机制上并不相同。

尽管如此,这种 " 现象相似但机制不同 " 的对应关系,为理解不同智能系统中的记忆可及性问题提供了一种统一的描述语言。

在机器学习研究中,类似的现象也在标准的连续学习(continual learning)设置中被反复观察。例如多任务学习 MLP 实验:任务 1 识别 MNIST 手写数字(0 和 1),准确率达 99%;任务 2 识别 FashionMNIST 服饰(T 恤和裤子),准确率达 95%,不做任何抗遗忘处理。结果表明:任务 2 训练后,任务 1 准确率从 99% 暴跌到 9%,复现 " 灾难性遗忘 "。但推理时放大任务 1 的 " 键值对 " 分量(模拟激光激活大脑沉默记忆),无需重新训练,准确率随放大系数回升,最终回到 99%。这类现象进一步提示," 遗忘 " 在许多情况下更接近于检索竞争,而非信息彻底消失。

图 4:连续学习中的遗忘与再激活 [ 5 ] 。模型在先后学习任务 1(MNIST)与任务 2(FashionMNIST)后,任务 1 性能显著下降,但通过增强对应任务的激活路径,可部分恢复其输出能力。

这证明:任务 1 的记忆没被擦掉,只是被干扰成 " 沉默记忆 ",放大键值分量就能唤醒——和人类的遗忘与唤醒,逻辑完全一致。

五、结语:人工与自然智能的 " 记忆共鸣 "

这篇论文的核心贡献,并不在于提出某种新的工程方法,而在于提供了一种统一的解释框架——用键值记忆的视角,将脑科学、认知心理学与机器学习中的记忆机制联系起来,使 " 信息如何被存储与检索 " 这一问题可以在同一抽象层面被讨论。

需要指出的是,键值记忆仍是一种计算层面的建模工具,更适合作为解释框架,而非对大脑机制的最终定论。大脑记忆系统涉及多脑区协同与多尺度动态过程,其复杂性远超过简单的 " 键—值 " 二分结构。因此,这一框架的意义不在于宣称 " 大脑等同于某种计算模型 ",而在于提供了一种跨领域可对话的概念语言,使不同学科能够在同一抽象层面讨论记忆问题。

在这一框架下,一些现象获得了更统一的理解:无论是人类记忆中的 " 暂时想不起来 ",还是机器学习中的灾难性遗忘,都可以被看作是检索过程受阻或竞争增强的结果,而非信息完全消失。这一视角也为人工智能提供了启发:通过引入类似 " 索引与内容分离 " 的结构设计,或增强特定路径的选择性激活,有望提升模型在连续学习中的稳定性。

从更宏观来看,这种跨领域对照并不是结论,而是一种起点。它提示我们,当人工智能与神经科学在同一概念框架下对齐时,既可能加深对大脑的理解,也可能推动更具持续学习能力的人工系统设计。

感兴趣可查看论文官方代码仓库(https://github.com/kazuki-irie/kv-memory-brain),亲身体验键值记忆的魅力——了解 AI 的记忆逻辑,也是在了解我们自己的大脑。

参考资料

[ 1 ] McClelland, J.L., McNaughton, B.L., and O ’ Reilly, R.C. ( 1995 ) . Why there are complementary learning systems in the hippocampus and neocortex: insights from the successes and failures of connectionist models of learning and memory. Psychol. Rev. 102, 419 – 457. https://doi.org/10. 1037/0033-295X.102.3.419.

[ 2 ] Wiltgen, B.J., Zhou, M., Cai, Y., Balaji, J., Karlsson, M.G., Parivash, S.N., Li, W., and Silva, A.J. ( 2010 ) . The hippocampus plays a selective role in the retrieval of detailed contextual memories. Curr. Biol. 20, 13361344. https://doi.org/10.1016/j.cub.2010.06.068

[ 3 ] Chanales, A.J.H., Oza, A., Favila, S.E., and Kuhl, B.A. ( 2017 ) . Overlap among spatial memories triggers repulsion of hippocampal representations. Curr. Biol. 27, 2307 – 2317.e5. https://doi.org/10.1016/j.cub.2017. 06.057.

[ 4 ] Guti é rrez B J, Shu Y, Gu Y, et al. HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models [ J ] . arXiv preprint arXiv:2405.14831, 2025.

[ 5 ] Gershman et al., Key-value memory in the brain, Neuron ( 2025 ) , https://doi.org/10.1016/j.neuron.2025.02.029

[ 6 ] Berens, S.C., Richards, B.A., and Horner, A.J. ( 2020 ) . Dissociating memory accessibility and precision in forgetting. Nat. Hum. Behav. 4, 866 – 877. https://doi.org/10.1038/s41562-020-0888-8.

[ 7 ] Wiltgen, B.J., Zhou, M., Cai, Y., Balaji, J., Karlsson, M.G., Parivash, S.N., Li, W., and Silva, A.J. ( 2010 ) . The hippocampus plays a selective role in the retrieval of detailed contextual memories. Curr. Biol. 20, 13361344. https://doi.org/10.1016/j.cub.2010.06.068

[ 8 ] Chanales, A.J.H., Oza, A., Favila, S.E., and Kuhl, B.A. ( 2017 ) . Overlap among spatial memories triggers repulsion of hippocampal representations. Curr. Biol. 27, 2307 – 2317.e5. https://doi.org/10.1016/j.cub.2017. 06.057.

[ 9 ] Berens, S.C., Richards, B.A., and Horner, A.J. ( 2020 ) . Dissociating memory accessibility and precision in forgetting. Nat. Hum. Behav. 4, 866 – 877. https://doi.org/10.1038/s41562-020-0888-8.

作者:贾梓杏 中山大学物理与天文学院 CIBR 吉妮实验室实习生

审核:张江 北京师范大学系统科学学院教授

出品:中国科协科普部

监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

NeuroAI 读书会

神经科学和人工智能领域的多位著名学者近日发表 NeuroAI 白皮书认为,神经科学长期以来一直是推动人工智能(AI)发展的重要驱动力,NeuroAI 领域的基础研究将推动下一代人工智能的进程。文章发表后引发热议:神经科学是否推动了人工智能?未来的人工智能是否需要神经科学?

本着促进神经科学、计算机科学、认知科学和脑科学等不同领域的学术工作者的交流与合作,集智俱乐部联合北京师范大学柳昀哲、北京大学鲍平磊和昌平实验室吕柄江三位研究员共同发起了「NeuroAI」读书会,聚焦在视觉、语言和学习领域中神经科学与人工智能的相关研究,期待能够架起神经科学与人工智能领域的合作桥梁,激发跨学科的学术火花。读书会已完结,现在报名可加入社群并解锁回放视频权限。

详情请见:

NeuroAI 读书会启动:探索神经科学与人工智能的前沿交叉领域

推荐阅读

1.  自然 · 神经科学评论:当 AI 开始同时 " 理解 " 大脑与行为

2.  Google DeepMind:为何 AI 只能模拟意识,而无法具现意识

3.  AI 也会 " 自我反思 "?Claude 模型现内省迹象,大语言模型认知新突破

4.  机器人集群如何组装出有趣形状?| Nat. Commun. 速递

5.  诚招系统科学 /AI/ 物理背景的内容创作者

6.  集智学园精品课程免费开放,解锁系统科学与 AI 新世界

7.  高考分数只是张入场券,你的科研冒险在这里启航!

8.  加入集智字幕组:成为复杂科学知识社区的 " 织网人 "

点击 " 阅读原文 ",报名读书会

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

人工智能 海马 短视频
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论