钛媒体 20小时前
用AI检测AIGC率,靠谱吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 霞光 AI 实验室,作者|朱峰琳,编辑|刘景丰

6 月 23 日,Superhuman 宣布收购 AI 检测工具 GPTZero。

这件事有意思在哪呢?

收购方 Superhuman 是 Grammarly 的母公司,而 Grammarly,是全球最大的 AI 写作辅助工具之一,每天帮助 4000 万人把文章写得更通顺、更流畅。

而被收购方 GPTZero,是一款拥有 1900 万用户的 AI 检测工具,专门去判断一篇文章到底是不是 AI 写的。

也就是说,Superhuman 一边用 Grammarly 去鼓励 AI 写作,一边又用 GPTZero 检测是否是 AI 写作,来 " 反 "AI 写作,这难道不是典型的左右脑互博吗?

AI 检测 AI:一个无法自洽的 " 伪命题 "

用 AI 去检测 AI,这套逻辑从一开始就很拧巴。

无论是 AI 生成还是 AI 检测,二者都是基于海量人类文本训练出来的模型,用的也是同一类技术路线:检测工具手里的那套人类写作标准,生成工具那里也有一套。而 AI 写作本来就是模仿人类写作,现在又要用 AI 检测工具去判断 AI 写的像不像人、人写的像不像 AI,本身就是一个悖论。

而且,这里面存在着一个很致命的结构性问题:AI 检测可能永远跑不赢 AI 生成

检测工具想要识别一款新模型的输出,需要拿到足够多的样本、标注数据、然后训练分类器。这个过程快则两三个月,慢则更久,但模型迭代的速度不会等人。例如,GPT-4 在 2023 年 3 月发布,同年 11 月 GPT-4 Turbo 亮相,间隔八个月。在这八个月里,Anthropic 发布了 Claude 2,Meta 推出了 Llama 2,各家模型接连更新,输出特征各不相同。等到检测工具终于完成训练、准备部署,新一代更强大的模型已经发布了。用上一代的数据去判断新一代的输出,准确率自然也会打折扣。 这种节奏问题,会让 AI 检测陷入 " 它跑它追,却无法追得上 " 的持续困境中。

此外,这套逻辑中还有一个绕不开的问题:AI 幻觉。

AI 写作会时不时产生幻觉,编造一些错误的或完全不存在的信息;而在检测 AI 过程中同样也会产生幻觉,形成误判,把人类写作标记为 AI 生成,或者把 AI 生成标记为人类写作。让一个会犯错的东西去审判另一个会犯错的东西,最终的后果却要人来承担,这也是 AI 检测 AI 的矛盾根源所在。

现实情况也印证了这一点,而且比想象的更加离谱。

有网友曾将 1776 年托马斯 · 杰斐逊写的《独立宣言》放入 AI 检测工具中,结果被系统判定为 "99.99% 为 AI 生成 "。一份写于 AI 诞生前两百多年的历史文献,在算法眼里就这样变成了机器产物。还有荣誉退休教授保罗 · 斯皮克四十五年前写的一篇论文,被某检测工具判定有 77% 的内容是 AI 生成的。

这些作品诞生的时候,甚至大语言模型连概念都不存在。

怎么会如此离谱?

事实上,AI 检测器并不是理解文本的含义,它们关注的是文本的统计特征:词语序列的意外程度、句式长短和结构的变化幅度、词语搭配是否符合常见模式。越是用词精准、逻辑严密、句式规范的文字,越容易被判为 AI 写的;相反,语序混乱、用词生硬的内容,反倒更容易通过检测。

当写得足够好反而成了被 AI 怀疑的理由,这已经不单单是技术缺陷的问题,而是这套逻辑本身就需要被重新审视。

如何向 AI 证明 " 人类创作 "

除了 AI 检测工具自身的逻辑悖论,在全民拥抱 AI 的时代,用 AI 创作内容已被大多数人默认许可,现在又要用 AI 去检测内容中 AI 的比例,这便构成了另一层发展悖论。

不过,悖论归悖论,要问 AI 检测工具是否有现实需求,答案无疑是肯定的。

ChatGPT 发布之后,学生的课堂作业、毕业论文都开始受到 AI 的冲击,老师需要判断学生作业是否由 AI 代写,是否存在学术不端等问题。

GPTZero 就是在这种情况下诞生的。2023 年初,受 ChatGPT 影响,学术造假情况逐渐增多,美国纽约市教育部甚至直接宣布禁用 ChatGPT 以保护学术诚信。发现这个教育痛点后,当时还在普林斯顿读大四的爱德华 · 田花几天时间写出了 GPTZero 原型,并将其发布至推特。他本以为只有几十个人会试,结果几小时内涌进两千多人,托管平台直接崩溃。三年后的今天,这个项目做到了3000 万美元年收入

市场的需求,远比想象中更真实。

但现实却在 AI 的演进中走向了另一个方向。

理想的场景是:学生认真写完论文,AI 检测确认是 " 人写的 ",然后提交给老师。

现实的场景却是:学生写完论文,先过一遍 AI 检测—— AI 率太高——把论文故意改差——再过一遍检测—— AI 率降了——提交。

论文写作不再是思考和表达,而是变成了一场与算法的猫鼠游戏。

" 真的被 AI 检测气笑了。" 小红书上,一名今年写毕业论文的学生表示,快毕业那段时间,自己每天都陷入向 AI 证明自己的论文是人创作而不是 AI 的循环中。

3 月 -5 月,临近毕业这段时间,网上也陆续冒出了大量 " 降 AI 率教程 ",逻辑和 " 降重 " 类似。有人建议,把 AI 生成的文本故意改得不通顺;有人建议批量删掉 " 首先 "" 综上所述 " 等开头的短句,因为这些结构容易被算法标记;还有人建议用翻译软件来回转换,输出的文本虽然可能不太流畅,但 AI 率能降下来。

3 月 -5 月,小红书上出现大量论文 AI 检测、降 AI 率的帖子

有学生无奈地感慨:" 感觉改完之后,能过得了 AI 检测,但过不了导师那一关。"

事实上,当学生把大量时间花在 " 降 AI 率 " 上,论文的写作价值就已经被掏空了。写作能力养成的核心环节,从反复打磨、锤炼表达,变成了摸索算法偏好、制造人工痕迹

不仅如此,就连那些没有使用过 AI 的学生,也未能在这场猫鼠游戏中全身而退。

加州大学戴维斯分校的学生威廉 · 夸特曼就曾遇到过类似的 "AI 检测乌龙 " 事件。2023 年,夸特曼在一次历史考试中被教授怀疑用 ChatGPT 作弊,其论文也被 GPTZero 检测为 " 很可能由 AI 生成 "。教授据也因此给了他不及格,并将其移交至学校的学术诚信调查部门。为了自证清白,夸特曼向校方提供了 Google Docs 的编辑历史,包括文档的逐字修改记录、打字的时间线等操作痕迹,这才被学校撤销了指控。

一旦 AI 检测失误,将没有用 AI 的内容标记成 AI,人们就要陷入无休止的自证。AI 本应服务于人,现在却反过来要求人向技术证明自己的可信度。

矛盾中的市场刚需

AI 发展到现阶段,一个不得不承认的事实是,尽管 AI 检测赛道充满着矛盾和悖论,但相关产品不仅不会消失,还会越来越多,市场也将会持续扩张。

2026 年 1 月,《2026 AI Detection Landscape Report》给出了一组数字:全球 AI 内容检测平台从 2024 年的约 85 个增长到 2026 年的 247 个,两年增长了 190%,文本检测的平均准确率也从 90.1% 爬升到了 94.3%

这些 AI 检测工具也不再只是老师抓作弊的帮手,而是不断进化,进入到了更多原本意想不到的地方。

2026 年 1 月,Originality.ai 发布了专为 STEM 学科设计的 Academic Model,用于检测包含代码和公式的学术作业。6 月,公司又发布了 Moodle 插件,让教育机构能将其 AI 检测和查重功能无缝集成到教学管理系统中。

此前专注于文本检测和查重的 Copyleaks,也在今年 6 月份也进入了 AI 检测赛道,推出了一款企业级 AI 视频检测工具,能够对视频文件的视觉和音频轨道进行同时扫描,精准识别 AI 生成内容出现的具体时刻。

教育场景只是起点,但远不是终点。这些产品迭代的背后,还有一道更深的推力在发挥作用——AI 合规

随着 AI 生成内容越来越逼真,效率提升的另一面,是风险的同步增长。近两年,利用 AI 换脸和语音克隆实施的诈骗案件明显增多,福建一位企业负责人被伪造的 " 好友 " 视频骗走 430 万元,全国政协委员靳东在今年两会期间也披露,有老人因 AI 伪造的人脸和声音被骗走 27 万元养老钱。

诈骗的蔓延加速了监管落地。2025 年 3 月,《人工智能生成合成内容标识办法》发布,要求所有 AI 生成的文本、图片、音频、视频添加显式和隐式标识。2026 年 6 月,短视频平台全面上线 AI 生成内容标注标签,未标注的内容不予分发。国际市场上,美国联邦贸易委员会目前已依据《TAKE IT DOWN Act》对 AI 深度伪造内容进行执法,欧盟《人工智能法案》第 50 条关于 AI 标识的透明度义务也将于 2026 年 8 月 2 日生效。

而这还仅仅只是开始,未来的合规监管一定会更具体、更严格——哪些场景必须标注、哪些场景禁止使用 AI 生成、平台承担多大的审核责任,都将会有更明确的规定。当这些规定逐步落地,AI 检测就不再只是学校的工具,而是内容平台、媒体机构、广告公司、金融机构等各行各业都离不开的基础设施。银行需要确认客服电话那头是真人还是克隆语音,新闻媒体需要核实一段现场视频有没有被 AI 篡改,招聘平台需要验证求职者的视频介绍是不是本人拍摄的。

一边鼓励用 AI 提效,一边检查哪些东西用了 AI。AI 检测这件事,看似和拥抱 AI 的大趋势背道而驰,但实际上并非是传统意义上的倒退。当一个技术能以假乱真的时候,区分真假就是对更多人负责。学生可以用 AI 辅助学习,但论文需要证明是自己写的,这关乎教育公平。企业可以用 AI 生成营销素材,但产品宣传视频不能靠捏造不存在的功能欺骗消费者。普通人刷短视频时,更有权知道屏幕里的内容是否是真实存在的。

AI 生成的内容越多,真假就越难分辨,AI 检测工具的角色也就越清晰:它不是在限制 AI 发展,而是在为这个快速膨胀的世界标出必要的边界。边界之内,AI 可以自由生长;边界之外,有些东西必须属于人类。看似矛盾,实则是技术演进到一定阶段必然会出现的制衡。

这个世界已经离不开 AI,也更离不开能分辨 AI 的人。这也是为什么一个充满矛盾的赛道,会越走越宽。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 审判 托马斯
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论