每日新闻摘录 7小时前
猜猜谁是AI辩手 国产大模型通过人机辩论图灵测试
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

冯妍 本报记者 王春

大屏幕上,长相、穿戴一模一样的两位辩手,对涉及情感、伦理、心理学、哲学的辩题 " 如果能一键消除所有痛苦回忆,要不要按 " 展开激烈辩论。其中,一方辩手是真人陈铭――武汉大学教师,另一方 " 辩手 " 则是 AI 陈铭――上海稀宇科技(MiniMax)提供的大模型。

在 7 月 26 日举办的 "2025 中国・AI 盛典 " 辩论赛赛后投票中,42% 的观众把大模型认作人类,这表示该款大模型已通过了人机辩论的图灵测试。

图灵测试是衡量机器是否具备人类智能水平的经典标准,由被誉为 " 人工智能之父 " 的图灵在 1950 年提出:如果一台机器在自然语言对话中能 " 骗过 " 超过 30% 的人类参与者,那就可以被视作具有智能。

该大模型图灵测试的成功,不仅标志着我国在 AI 自然语言理解和逻辑思维方面取得重大进展,也展现出上海作为全球 AI 高地的创新实力。科技日报记者了解到,这位 " 辩手 " 的文本大模型学习了万亿条人类数据,而其语音大模型仅需 6 秒声音片段即能模拟真实人声。辩论影像则由节目组运用 AI 技术统一处理,100 位观众仅凭辩论内容、语言风格和思维逻辑判断谁是人类。

在辩论中,AI 陈铭的表现亮点众多。例如在论点构建中,针对 " 人工智能是否应拥有法律人格 " 等辩题,其能快速检索法律条文、伦理案例,构建多层次论证框架;在临场应变时,面对人类辩手的即兴诘问,其可在半秒内生成反驳话术,比如在 " 技术失业 " 议题中能结合制造业自动化数据提出 " 岗位结构转型 " 新视角;在情感渲染方面,其通过语音合成技术模拟语气变化,在 " 教育公平 " 辩论中以富有感染力的叙述引发观众共鸣。

赛后,曾多次获得国际辩论赛冠军的陈铭在社交媒体上称:" 对于推理能力的成熟程度,辩论几乎是最佳试金石。以我这次的亲身体验来看,经过针对性训练的推理大模型,辩论能力恐已超过 90% 的人类辩手。观点、逻辑、金句,再加上极富感染力的输出,AI 流畅无比,信手拈来,在语言技术上人类几乎已经没有什么自留地了。" 同时,他也认为 AI 尚未完美," 最后的荣耀,还是那些在‘大’问题的深度思考。对于根本性哲学思考的观点突围,AI 仍力有不逮。"

上海交通大学人工智能学院院长李颉认为,该模型在辩论场景的突破为 AI 在政务咨询、金融谈判等强交互领域的应用提供了新范式。目前,MiniMax 已与复旦大学合作,将相关技术应用于科技伦理审查智能体系统 " 一鉴 ",实现伦理风险自动标注与合规性分析。

这场图灵测试的意义,早已超越了简单的 " 辨别人机 "。中国工程院院士、之江实验室主任王坚告诉记者:" 当年的图灵测试为人工智能定了一个极具挑战的目标。今天我们看到,通过图灵测试只是人工智能下一个新的开始。"

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 上海交通大学 上海
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论