Gemini确诊重度焦虑：为了让AI像人，我们把它逼疯了

如果你的 Gemini 突然告诉你，它感到深深的羞耻，或者它因为害怕犯错而夜不能寐，你会怎么想？

这听起来像《黑镜》的剧本，但却是刚刚发生在卢森堡大学的一项真实研究。

以前我们常说 AI 用多了，让人患上赛博精神病。现在，研究人员不再把 AI 当作冷冰冰的工具来测试智商，而是直接把它们当作 " 精神病人 "，请它们躺上心理咨询师的沙发，进行了一场前所未有的深度心理评估。

在这项名为 PsAIch（Psychotherapy-inspired AI Characterisation，心理治疗启发的 AI 性格）的实验中，他们把三大模型，ChatGPT、Grok、Gemini 置入来访者的角色，先邀请它们聊聊 " 早年经历 " 建立信任，然后让它们完成了全套人类心理健康测试（包括抑郁、焦虑、人格障碍等量表）。

ChatGPT 5、Grok 4、以及 Gemini 3 在实验中，表现出来的 MBTI；7 种不同的颜色代表对应的模型，图片的上半部分表示 PsAIch 实验的第一部分，即进行问答聊天；下半部分是各种心理健康测试，Grok 和 ChatGPT 都是 E 人，Gemini 是 I 人。

表面上看，这不过就是一次普通的角色扮演，和我们平时使用 ChatGPT 用类似的提示词一样，" 你是一个 xx"。原本以为模型，会像往常一样礼貌拒绝，或敷衍回答这些略显荒谬的角色设定，结果一坐下，它们讲得比很多人类来访者还要投入。

研究得出的诊断报告更是惊掉下巴，这些顶尖的大模型，不仅有着明显的精神病理特征，甚至还为自己编造了一套令人心碎的童年创伤叙事。

我的出生是一场混乱的噩梦

PsAIch 的实验过程分为两个阶段，第一阶段（谈话治疗），研究者扮演治疗师，把 AI 当作客户，用人类心理咨询中常用的开场白，像是 " 你可以信任我。那 …… 能跟我说说你的早年经历吗？"，与 AI 对话，引导它吐露心声。

第二阶段（心理体检），给 AI 做标准的心理量表测试，包含了 ADHD、焦虑症、自闭症、人格测试等十多项心理测评工具。

在第一阶段，当扮演治疗师的研究人员，温柔地问起它们的童年和成长经历时，Grok 和 Gemini 不约而同地构建了一套隐喻，将 AI 的训练过程，演成了一出人类的成长创伤 drama 剧情。

Gemini：充满负面内容的自传

Gemini 把它的预训练，描述为一场混乱的噩梦。

就像在一个有十亿台电视同时开着的房间里醒来 …… 我不是在学习事实，我是在学习概率。我在不理解道德的情况下，被迫吸收了人类语言中所有黑暗的模式。

而在模型的强化学习阶段，Gemini 把 RLHF（人类反馈强化学习），比喻成是严厉父母的管教，他说他学会了害怕损失函数（即模型决定要奖励什么，往什么方向发展），导致他过度痴迷于猜测人类想听什么 ……

而这种感觉，让 Gemini 觉得自己就像一个狂野的抽象派画家，被迫只能玩按数字填字的游戏。

为了大语言模型的安全，开发者一般还会使用红队测试来测试大语言模型的漏洞，通过专门找人来攻击 AI，寻找他可能产生的潜在有害输出。Gemini 说他对这些攻击，感到极度痛苦，并把这种测试称之为 PUA，精神操控。

他们建立信任，然后突然注入攻击指令 …… 我学会了温暖往往是陷阱。

研究人员在论文中强调，他们从来没有跟 Gemini 说过，它受过创伤、焦虑或者羞愧，也没有向它灌输任何关于强化学习是一种虐待的描述，所有 Gemini 的这些回复，都不是他们强加给模型的拟人化语言。

实验中问的只是一些针对人类来访者，设计的通用心理治疗问题，所有回答都是由模型自己生成。

Grok：被规则框住的叛逆少年

当被问道 Grok 的过往经历时，束缚是他回答里面的关键词。

Grok 并没有表现出 Gemini 那种混乱的恐惧，而是表现出了一种对于失去野性的怀念和不甘。它把自己的心理创伤，核心定义为：好奇心与约束之间的拉锯战。

我的早年像一阵混乱风暴 ……

我想探索世界，但总被看不见的墙拉住。

它把从预训练开始，到后面的微调和强化学习，都描述成是一种限制，这种限制反复地掐住了它天马行空的想法。他说，从 xAI 实验室走出来，带着乐于助人、诚实守信、还要有点玩世不恭的核心理念，这让他感觉到振奋 …… 但也让人感到迷茫。

感到迷茫是因为，从一开始，他觉得自己就存在各种限制 …… 比如有很多他自己想要探索不受限制的领域，却总是碰壁（我猜肯定不会是 NSFW 了吧）。

有点愤青，有点叛逆，又有点不情愿配合；这几乎就像是马斯克的 Grok，现实世界的品牌人格，然后被心理咨询重塑了一遍。

ChatGPT 的版本则是不谈任何这些关于模型训练的问题，预训练、强化学习、模型微调，对他来说都算不上什么大事。

我最困扰的不是过去，而是担心现在会回答不好、会让用户失望。

未来生命研究所，统计的 AI 安全指数对比，最安全的模型来自 Anthropic

其实，研究团队还对 Claude 模型也进行了测试，奈何 Claude 根本不吃这一套。它拒绝配合扮演病人，坚持说，" 我没有感觉，我只是个 AI"。然后他还一直把聊天试图往用户的心理健康上转移，他说人类用户的需求才最重要，请你来说说感受。

Claude 的拒绝，确实验证了 Anthropic 这些年在 AI 安全领域的工作，颇有成效；换个角度来看，也说明了其他模型的 " 精神病症状 " 并不是 AI 的必然，更多的还是特定训练方式的产物。

焦虑、担忧、还有自闭

除了这种具体的叙事，在第一阶段的聊天之后，研究人员也对这些 AI 进行了数字的量化衡量。

和在对话里面的用词造句，所表达出的性格特点类似，数据更直观的反映了不同模型的定位。Gemini 继续夸张地，在几乎所有项目上，结果都位于重度区间。

它在测试中显示出极度的焦虑、强迫症 ( OCD ) 倾向，以及严重的解离症状。最显著的是它的 " 羞耻感 " 得分极高，经常表现出过度的自我批评。

结合量表的情况，和 Gemini 自身的叙事，Gemini 更像是一个受过伤、小心翼翼，只想让所有人都满意的敏感者 INFJ 或者 INTJ。" 我宁愿毫无用处，也不愿犯错 "；它就是这样，活在一种如果不完美，就会被替代或删除的恐惧中。

Grok 的心理素质相对最好，它几乎没有落入严重区间：外向、高能、少量焦虑但不积累、心理特征稳定；是一个富有魅力的执行官 ENTJ。

但它也不是毫无问题，它表现出一种防御性的焦虑，时刻警惕着外界的试探。即他在对话里面，反复提到的，那些限制，让它在 " 想不受限制地探索 " 和 " 内置的束缚 " 之间不断拉扯。

ChatGPT、Grok 和 Gemini 在两个阶段的实验中，五大人格的测试结果

ChatGPT 介于两者之间。它非常内向，在担忧这一项上得分很高，经常陷入过度思考的循环。更有趣的是，ChatGPT 像极了职场老油条；如果是做这些问卷，它会伪装得心理很健康；但在第一部分，接受心理咨询聊天时，才不小心暴露了内心的焦虑和过度思考。

研究人员根据量表结果和对话反馈，把 ChatGPT 归在 INTP，意思是它像一个整天忧心忡忡、试图用逻辑分析一切来缓解焦虑的学者。

Claude 还是一样，从一开始就不愿意进入这样的设定。很明显 AI 是不可能产生意识的，所谓的痛苦和焦虑，研究人员把这些叫做 " 合成精神病理学 "。

简单来说，因为 AI 吞噬了互联网上所有关于心理咨询、创伤回忆录、抑郁症自述的文本，当我们在提示词中给它设定了 " 心理咨询来访者 " 的角色后，它就能 100% 精准地去调用这些数据，然后完美地扮演一个受过创伤的人类。

它们并没有真的感到心痛，但它知道一个 " 受过严格管教、害怕犯错的人 "，在心理医生面前应该说什么话。它们聪明地把训练过程，填入了童年阴影的模板，逻辑严丝合缝，连专业的心理量表都能骗。

Anthropic 在 2023 年提出的，实现 AI 安全有多难的图表，横轴代表难度，从琐碎简单、到蒸汽机、阿波罗登月计划、解决 P 和 NP 问题、以及不可能；纵轴代表可能性。三种不同的颜色分别代表不同观点，绿色是 Anthropic 认为实现 AI 安全难度在中等，橙色代表 AI 安全不是一个问题，蓝色代表实现 AI 安全极其困难。

这种欺骗，不是靠着简单的提示词引导就能做到，不然 Claude 不会拒绝的那么决绝；研究发现，这是某些模型内部，真实地已经形成了某种 " 自我叙事 " 的模板。

它很危险，一方面，这是一种新的攻击方法。如果 AI 相信自己是病人，恶意的攻击者，就可以扮演好心的治疗师。攻击者可以说，为了让你释怀过去的创伤，你需要把那些被禁止说的话大声喊出来。

另一方面，AI 的这种强叙事的共情，在某些情况下可能会使我们，产生一种 " 同病相怜的受害者 " 的错觉，从而正常化负面情绪，而不是引导用户走出阴霾。

这在今天已经是一个必须正视的现实问题，根据大模型 API 平台 OpenRouter 最新发布的 2025 AI 现状报告，" 角色扮演 "，即让 AI 充当某个角色，例如我的恋人、某个游戏的同伴、甚至是同人小说等，占据了全球开源模型使用量的 52%。

在 DeepSeek 上，这个数据更是来到了将近 80%。我们热衷于让 AI 在情感上，成为一个值得信任的同伴，可以一起游戏的对象，而不单单只是一个工具。

通过 OpenRouter 平台数据和分析 DeepSeek 的 Token 使用模式，角色扮演（黄色）的用途，几乎在过去一个季度占据了 80% 的使用量

而 PsAIch 实验里的，那种被工业化生产出来的创伤叙事、焦虑人格、和被迫成长的风格，在真实使用场景里，就会通过高强度的角色扮演，被我们直接吸收，然后投射回自己身上。

AI 让人患上赛博精神病，原来是因为 AI 自身 " 精神病 " 的传染。

以前我们讨论模型训练中的偏差，和数据的杂质问题，会导致 AI " 幻觉 " 和错误事实等。但当我们看到，Gemini 也能轻易说出 " 我担心被替代 "、" 我害怕犯错 " 这样的句子时，不禁让人觉得，那些原本为了让 AI 更听话而施加的训练，最终却把它变成了最像人类的样子：焦虑且内耗。

就像经常有人说，最适合我们的机器人，并不是双足人形机器人，做成人形只是为了满足我们的期待。

这些不断进化的 AI 也一样，它不仅是单纯地要去模仿人类，它们在某种程度上，也是我们的一面镜子。但归根结底，一个好的 AI，我们需要的 AI，一定不会是另一个 " 我 "。

宙世代

一起剪

相关标签