
导语
为什么许多社交智能体 " 写得通顺,却一眼假 "?问题往往不在语言能力,而在它们既不像某个稳定的个体,也未真正嵌入社会关系网络。北京通用人工智能研究院联合北京大学研究提出自演化社交智能体 EvoBot,通过生成器与检测器的对抗博弈,让模型在社会反馈中持续升级,逐步学会更真实的个性化表达与社会化互动。
关键词:社交智能体、拟人化生成、个性化、社会化、对抗学习、自演化
孔繁奇、封雪丨作者

论文题目:Enhancing LLM-Based Social Bot via an Adversarial Learning Framework
论文链接:https://aclanthology.org/2025.emnlp-main.1185/
发表时间:2025 年 11 月 4 日
论文来源: EMNLP 2025
社交平台上,一条 " 像人 " 的动态不只取决于语法和知识,更取决于两个更隐蔽的因素:它是否贴合某个具体个体的稳定风格(个性化),以及它是否会被周围社交邻居持续塑造(社会化)。不少大模型 " 写得对 ",却仍然 " 一眼假 ",问题往往不在句子通不通顺,而在它不像某个具体的人在某个具体的圈子里说话。
北京通用人工智能研究院联合北京大学提出了自演化社交智能体 EvoBot,在 " 生成器 - 检测器 " 的对抗博弈框架下,把拟人化生成变成一个能自动升级难度的训练任务,使模型在社交网络中持续迭代。相关成果已被自然语言处理顶会 EMNLP 2025 接收并作 Oral 展示。
问题:社交智能体为什么常常 " 一眼假 "?
当前社交智能体的一个核心瓶颈是 " 既个性化又社会化 "。个性化关乎个体差异,同样是表达赞同,有人简短直接,有人爱用反问,有人习惯加表情或话题标签。社会化关乎邻域影响,好友关系、社区氛围与热点事件会持续改变一个人的发言内容与立场走向。只学到 " 通用写作能力 " 的大模型,往往会留下两类稳定的可识别痕迹。其一是风格过于平均,不像某个稳定个体的长期表达分布;其二是生成内容缺少社会语境,看起来像 " 单机写作 ",而不是在关系网络里互动。针对这两个问题,本文提出了一个两阶段训练框架优化模型,先让模型更像某个具体的人,再让模型在 " 社会反馈 " 的压力下持续修正自己的表达策略。
方法:把拟人化训练变成 " 矛与盾 " 的持续博弈
EvoBot 的关键设计,是把 " 像人 " 变成一场持续升级的对抗。框架里,生成器(EvoBot)负责模仿人类发布社交动态,检测器(Detector)负责区分 " 真实人类内容 " 和 "AI 生成内容 "。具体而言,EvoBot 的学习分为两个阶段:
第一阶段:监督微调(SFT),注入个体 " 人格 "。在此阶段,本文利用真实人类用户数据对基础大模型(Llama2-7B)进行监督微调。训练任务是让模型初步学习该社区的表达方式、语言习惯等。通过这一过程,EvoBot 初步具备了模仿不同个体、生成个性化内容的能力,这构成了每个智能体的 " 初始人格 "。
第二阶段:对抗性学习,驱动动态 " 演化 "。本文设计了一个由 EvoBot(生成器)和基于关系图卷积神经网络(R-GCN) [ 2 ] 的 Detector(检测器)构成的对抗性学习闭环。与传统方法不同,本文的生成器和检测器是相互适应、协同演化的。在每一轮迭代中,EvoBot 生成一批新的 " 拟人 " 内容,而检测器的任务就是从这些内容和真实人类内容中,把 AI 的 " 仿冒品 " 揪出来。如果 EvoBot 生成的内容成功 " 骗过 " 了检测器,就会被标记为 " 更优 " 样本,指导模型朝这个方向优化;反之,则被标记为 " 较差 " 样本,从而构造出偏好数据对,通过直接偏好优化(DPO) [ 3 ] 技术驱动 EvoBot 学习。最关键的是,检测器自身也在不断升级。每一轮博弈后,检测器会将 EvoBot 的 " 更优 " 样本集加入自己的错题集进行再训练,提升识别能力。这就为 EvoBot 创造了一个任务难度持续提升的学习环境,迫使其不断学习和模仿更高级、更难以分辨的人类行为模式,最终形成一个能力持续增强的良性循环。

图 1: EvoBot 框架概览
实验:个体层更像人,群体层更像社会
EvoBot 不是在 " 干净、单一 " 的文本集合里训练,而是直接从真实社交网络中抽取结构与语境。研究使用 TwiBot-22 数据集 [ 4 ] ,包含约 100 万用户、近 1 亿条推文以及好友关系等图结构信息。为了在可控成本下保留网络结构差异,研究采用 Louvain 社区发现方法切分出 12 个高度连接且具有代表性的社区,这些社区在拓扑形态(星形、网状等)、语言(英语、阿拉伯语、日语、土耳其语等)与话题上都呈现明显差异。这种异质性为本文训练和评估 EvoBot 在复杂、多元环境下的适应性和类人程度供了坚实的基础。

图 2: 12 个社区中用户连接关系的可视化

表 1: 社区数据统计,包括用户与机器人的数量、边的数量、推文数量和代表语言
具体地,本文在这 12 个社区上,从个性化和社会化两个角度系统地评估了 EvoBot。
个性化评估
首先,本文分析了 EvoBot 与检测器在 4 轮对抗训练中的 " 共同成长 " 过程。结果清晰地展示了两者间的协同进化。随着迭代的进行,EvoBot 规避检测的能力越来越强,意味着它生成的内容越来越类人(如图 3 中各行所示)。与此同时,检测器的识别性能也在不断提升(如图 3 中各列所示)。

图 3:Detector 分类性能。左 :F1-score; 右 :Accuracy。行表示检测器的版本;列表示 EvoBot 的版本。色块上数值越大表示 EvoBot 被识别出来的概率越高。
本文对比了最终版的 EvoBot 与六种基线模型(包括原始 Bot、传统 GAN、Llama2-7b、GPT-4o-mini,以及两个消融版本)。在两种不同架构(RGCN 和 GAT)的检测器下,EvoBot 均取得了最低的被识别率,展示了其最强的拟人化生成能力。消融实验也证明,监督微调(SFT)和对抗学习(ADV)两个阶段对于最终的优异性能缺一不可。同时,进一步分析表明 EvoBot 在生成内容多样性和表达风格上都达到了很高的类人水平,这说明 EvoBot 不仅能生成类人的社交文字而且对人类社交方式有更深层次的理解。

表 2: RGCN 和 GAT 检测器下不同生成器的 Accuracy 和 F1-Score。数值越小,说明生成器逃避检测的能力越强。
社会化评估 1: 群体观点模拟
实验将 EvoBot 置于多智能体模拟环境中,复现了真实世界中关于 "COVID-19" 和 " 俄乌冲突 " 两大事件的观点演变过程。实验结果表明,相比于传统的基于规则的智能体模型(如 BC 和 Lorenz 模型)以及其他 LLM 基线,无论是在群体平均观点还是观点多样性上,EvoBot 都最接近真实数据,成功捕捉到了现实群体中复杂动态的观点变化。这些对比指标均是在事件发生的一段时间内的统计结果,充分证明了 EvoBot 的优势在于精准捕捉了观点的动态演变过程,而不仅是拟合某个静态的结果。

表 3: 群体观点的模拟结果
社会化评估 2: 信息传播模拟
本文还模拟了关于 " 超级碗赛事 " 这一热点新闻在社交网络中的传播过程。结果显示,相比于基线模型,EvoBot 驱动的信息传播曲线更贴近真实世界的传播模式,即 " 初期快速爆发,随后逐渐放缓 " 的典型规律。这些群体层面的涌现现象,强有力地证明了 EvoBot 框架在模拟复杂社会动态方面的有效性和先进性。

图 4: 随着时间的推移,讨论洛杉矶公羊队超级碗夺冠的累积用户数量变化曲线
总结展望:为什么 " 自演化 " 很重要?
在 " 生成器 - 检测器 " 的对抗学习框架下,基于大模型的社交智能体 EvoBot 持续提升能力,在个性化内容生成和宏观社会现象模拟方面均表现出色,验证了该框架的有效性。
EvoBot 所展示的这种自动化的、无需持续外部干预的 " 自演化 " 学习框架,为各行业构建更智能、更具适应性的 AI 智能体提供了一种新的思路和启发。这种通过对抗博弈创造动态学习环境、驱动智能体持续迭代的方法,为解决 " 如何让智能体在部署后仍能自主学习和进化 " 这一核心难题提供了宝贵的探索,对未来开发更稳健、更自主的人工智能系统具有一定的借鉴意义。
参考文献
[ 1 ] Kong, F., Zhang, X., Chen, X., Yang, Y., Zhu, S. C., & Feng, X. ( 2025, November ) . Enhancing llm-based social bot via an adversarial learning framework. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing ( pp. 23246-23271 ) .
[ 2 ] Schlichtkrull, Michael, et al. "Modeling relational data with graph convolutional networks." European semantic web conference. Cham: Springer International Publishing, 2018.
[ 3 ] Rafailov, Rafael, et al. "Direct preference optimization: Your language model is secretly a reward model." Advances in neural information processing systems 36 ( 2023 ) : 53728-53741. Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 ( 2022 ) : 35254-35269.
[ 4 ] Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 ( 2022 ) : 35254-35269.
群体智能读书会
如果你对这些反直觉但极有用的现象感兴趣——从蚁群搭桥、鱼群同步、到无人机集群表演、集群机器人协作、群智优化与多智能体系统、网络舆论建模研究等——欢迎加入「群体智能」读书会:我们用动物—人类—机器三条线,希望把群体智能的涌现这件事讲清楚、讲透彻;用物理学、数理逻辑、多主体建模、计算传播等多学科视角,去追问同一个核心:集群何以比个体更聪明?群体智能又在何时涌现?
集智俱乐部联合北京师范大学系统科学学院韩战钢教授、暨南大学计算传播研究中心赵甜芳副教授、新疆大学物理科学与技术学院玉素甫 · 艾比布拉副教授等来自 11 所高校的学者,共同发起本次「群体智能」读书会,尝试用一条普适的线索,把自然界的鸟群蚁群、人类社会的集群行为、以及人工智能时代的多智能体与群智优化,放在同一张地图上重新理解。读书会自 2026 年 1 月 17 日开始,安排在每周六下午 14:00 – 16:00,欢迎所有对群体智能如何涌现、如何被理解、以及如何被设计,感兴趣的朋友一起加入:带着问题来,带着更有趣的问题去。

详情请见:生物、机器与社会的群体智能—— 11 所高校联合发起的群体智能读书会

推荐阅读
1. 自然 · 通讯:当环境 " 说谎 " 时,智能体如何做出可靠决策?
2. 对谈:从动物群体行为到大脑空间决策,复杂性如何启发智能探索?
3. 张倩:那个养鸡的物理学家来集智了——从 " 鸡群智能 " 到 " 人类群体智能 "
5. 集智学园精品课程免费开放,解锁系统科学与 AI 新世界
7. 加入集智字幕组:成为复杂科学知识社区的 " 织网人 "
点击 " 阅读原文 ",报名读书会


登录后才可以发布评论哦
打开小程序可以发布评论哦