集智俱乐部 03-13
PNAS速递:用于判断AI与人行为相似性的图灵测试
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

关键词:人工智能,图灵测试,聊天机器人

论文题目:A Turing test of whether AI chatbots are behaviorally similar to humans

论文期刊:PNAS

论文链接:https://www.pnas.org/doi/10.1073/pnas.2313925121

随着人工智能(AI)技术的迅速发展,AI 与人类在越来越多任务上的互动成为不可避免的趋势。特别是在大型语言模型取得显著进展的背景下,关于 AI 能否模仿人类行为、辅助或甚至超越人类能力的讨论愈发热烈。这些讨论不仅涉及 AI 在写作、答题、编程、经济建议或创意开发方面的潜力,也包括它们对劳动市场和更广泛社会影响的潜在影响。随着某些 AI 的角色涉及决策制定和与人类的战略互动,理解它们的行为倾向变得尤为重要,尤其是在其开发和训练过程复杂且不透明的情况下。探索 AI 是否选择与人类相似的行动或策略、它们是否表现出独特的个性和行为特征以及这些策略和特征在不同环境下是否一致,对于我们继续将 AI 融入日常生活至关重要。

最近在《美国国家科学院院刊》(PNAS)上发表了一项研究,通过对一系列 AI 聊天机器人进行图灵测试,评估它们的行为和性格特征。研究团队使用了 ChatGPT 的变体,并让机器人参与了一系列经典行为游戏。这些游戏旨在揭示信任、公平、风险规避、利他主义和合作等特征。研究团队还让 AI 回答传统的大五人格心理测试,以测量其性格特质。

研究结果显示,ChatGPT-4 在行为和人格特质上与随机选取的来自 50 多个国家的成千上万名人类样本统计上没有显著差异。聊天机器人还能根据之前的经验和上下文来调整自己的行为,似乎它们通过交互学习并根据不同的测量情境框架来改变行为。当聊天机器人的行为偏离人类行为的平均值和众数时,它们倾向于表现出更合作和利他的行为。

该研究对于理解和评估 AI 在人类经验中日益增长的影响提供了新的视角和方法。通过将 AI 的行为与人类的行为进行比较,研究揭示了 AI 在多种维度上与人类行为的相似性和差异性。特别是,AI 展现出更合作和利他的行为特征,这为设计更人性化、社会友好的 AI 系统提供了有价值的见解。此外,通过了解 AI 的行为倾向和个性特征,我们可以更好地预测和指导 AI 在复杂社会互动中的角色,为其在社会环境中的潜在应用和发展方向提供重要参考。最后,需要注意的是,所测试的不同版本的 ChatGPT 之间存在行为差异,这表明类似模型的不同版本具有不同的个性和行为特征。

图 1 与人类受试者相比,ChatGPT-4 和 ChatGPT-3 在 " 大五人格 " 特征上的表现。蓝色、橙色和绿色线分别代表人类、ChatGPT-4 和 ChatGPT-3 的中位数得分,而阴影区域表示每个维度上得分的中间 95% 范围。尽管 ChatGPT-3 在开放性方面得分明显较低,但 ChatGPT 的人格特征仍在人类分布范围内。

计算社会科学读书会第三季启动

详情请见:

AI+Social Science:大模型怎样重塑社会科学 | 计算社会科学读书会第三季启动

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

ai 图灵测试 聊天机器人 人工智能 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论