用AI检测AIGC率，靠谱吗？

文 | 霞光 AI 实验室，作者｜朱峰琳，编辑｜刘景丰

6 月 23 日，Superhuman 宣布收购 AI 检测工具 GPTZero。

这件事有意思在哪呢？

收购方 Superhuman 是 Grammarly 的母公司，而 Grammarly，是全球最大的 AI 写作辅助工具之一，每天帮助 4000 万人把文章写得更通顺、更流畅。

而被收购方 GPTZero，是一款拥有 1900 万用户的 AI 检测工具，专门去判断一篇文章到底是不是 AI 写的。

也就是说，Superhuman 一边用 Grammarly 去鼓励 AI 写作，一边又用 GPTZero 检测是否是 AI 写作，来 " 反 "AI 写作，这难道不是典型的左右脑互博吗？

AI 检测 AI：一个无法自洽的 " 伪命题 "

用 AI 去检测 AI，这套逻辑从一开始就很拧巴。

无论是 AI 生成还是 AI 检测，二者都是基于海量人类文本训练出来的模型，用的也是同一类技术路线：检测工具手里的那套人类写作标准，生成工具那里也有一套。而 AI 写作本来就是模仿人类写作，现在又要用 AI 检测工具去判断 AI 写的像不像人、人写的像不像 AI，本身就是一个悖论。

而且，这里面存在着一个很致命的结构性问题：AI 检测可能永远跑不赢 AI 生成。

检测工具想要识别一款新模型的输出，需要拿到足够多的样本、标注数据、然后训练分类器。这个过程快则两三个月，慢则更久，但模型迭代的速度不会等人。例如，GPT-4 在 2023 年 3 月发布，同年 11 月 GPT-4 Turbo 亮相，间隔八个月。在这八个月里，Anthropic 发布了 Claude 2，Meta 推出了 Llama 2，各家模型接连更新，输出特征各不相同。等到检测工具终于完成训练、准备部署，新一代更强大的模型已经发布了。用上一代的数据去判断新一代的输出，准确率自然也会打折扣。这种节奏问题，会让 AI 检测陷入 " 它跑它追，却无法追得上 " 的持续困境中。

此外，这套逻辑中还有一个绕不开的问题：AI 幻觉。

AI 写作会时不时产生幻觉，编造一些错误的或完全不存在的信息；而在检测 AI 过程中同样也会产生幻觉，形成误判，把人类写作标记为 AI 生成，或者把 AI 生成标记为人类写作。让一个会犯错的东西去审判另一个会犯错的东西，最终的后果却要人来承担，这也是 AI 检测 AI 的矛盾根源所在。

现实情况也印证了这一点，而且比想象的更加离谱。

有网友曾将 1776 年托马斯 · 杰斐逊写的《独立宣言》放入 AI 检测工具中，结果被系统判定为 "99.99% 为 AI 生成 "。一份写于 AI 诞生前两百多年的历史文献，在算法眼里就这样变成了机器产物。还有荣誉退休教授保罗 · 斯皮克四十五年前写的一篇论文，被某检测工具判定有 77% 的内容是 AI 生成的。

这些作品诞生的时候，甚至大语言模型连概念都不存在。

怎么会如此离谱？

事实上，AI 检测器并不是理解文本的含义，它们关注的是文本的统计特征：词语序列的意外程度、句式长短和结构的变化幅度、词语搭配是否符合常见模式。越是用词精准、逻辑严密、句式规范的文字，越容易被判为 AI 写的；相反，语序混乱、用词生硬的内容，反倒更容易通过检测。

当写得足够好反而成了被 AI 怀疑的理由，这已经不单单是技术缺陷的问题，而是这套逻辑本身就需要被重新审视。

如何向 AI 证明 " 人类创作 "

除了 AI 检测工具自身的逻辑悖论，在全民拥抱 AI 的时代，用 AI 创作内容已被大多数人默认许可，现在又要用 AI 去检测内容中 AI 的比例，这便构成了另一层发展悖论。

不过，悖论归悖论，要问 AI 检测工具是否有现实需求，答案无疑是肯定的。

ChatGPT 发布之后，学生的课堂作业、毕业论文都开始受到 AI 的冲击，老师需要判断学生作业是否由 AI 代写，是否存在学术不端等问题。

GPTZero 就是在这种情况下诞生的。2023 年初，受 ChatGPT 影响，学术造假情况逐渐增多，美国纽约市教育部甚至直接宣布禁用 ChatGPT 以保护学术诚信。发现这个教育痛点后，当时还在普林斯顿读大四的爱德华 · 田花几天时间写出了 GPTZero 原型，并将其发布至推特。他本以为只有几十个人会试，结果几小时内涌进两千多人，托管平台直接崩溃。三年后的今天，这个项目做到了3000 万美元年收入。

市场的需求，远比想象中更真实。

但现实却在 AI 的演进中走向了另一个方向。

理想的场景是：学生认真写完论文，AI 检测确认是 " 人写的 "，然后提交给老师。

现实的场景却是：学生写完论文，先过一遍 AI 检测—— AI 率太高——把论文故意改差——再过一遍检测—— AI 率降了——提交。

论文写作不再是思考和表达，而是变成了一场与算法的猫鼠游戏。

" 真的被 AI 检测气笑了。" 小红书上，一名今年写毕业论文的学生表示，快毕业那段时间，自己每天都陷入向 AI 证明自己的论文是人创作而不是 AI 的循环中。

3 月 -5 月，临近毕业这段时间，网上也陆续冒出了大量 " 降 AI 率教程 "，逻辑和 " 降重 " 类似。有人建议，把 AI 生成的文本故意改得不通顺；有人建议批量删掉 " 首先 "" 综上所述 " 等开头的短句，因为这些结构容易被算法标记；还有人建议用翻译软件来回转换，输出的文本虽然可能不太流畅，但 AI 率能降下来。

3 月 -5 月，小红书上出现大量论文 AI 检测、降 AI 率的帖子

有学生无奈地感慨：" 感觉改完之后，能过得了 AI 检测，但过不了导师那一关。"

事实上，当学生把大量时间花在 " 降 AI 率 " 上，论文的写作价值就已经被掏空了。写作能力养成的核心环节，从反复打磨、锤炼表达，变成了摸索算法偏好、制造人工痕迹。

不仅如此，就连那些没有使用过 AI 的学生，也未能在这场猫鼠游戏中全身而退。

加州大学戴维斯分校的学生威廉 · 夸特曼就曾遇到过类似的 "AI 检测乌龙 " 事件。2023 年，夸特曼在一次历史考试中被教授怀疑用 ChatGPT 作弊，其论文也被 GPTZero 检测为 " 很可能由 AI 生成 "。教授据也因此给了他不及格，并将其移交至学校的学术诚信调查部门。为了自证清白，夸特曼向校方提供了 Google Docs 的编辑历史，包括文档的逐字修改记录、打字的时间线等操作痕迹，这才被学校撤销了指控。

一旦 AI 检测失误，将没有用 AI 的内容标记成 AI，人们就要陷入无休止的自证。AI 本应服务于人，现在却反过来要求人向技术证明自己的可信度。

矛盾中的市场刚需

AI 发展到现阶段，一个不得不承认的事实是，尽管 AI 检测赛道充满着矛盾和悖论，但相关产品不仅不会消失，还会越来越多，市场也将会持续扩张。

2026 年 1 月，《2026 AI Detection Landscape Report》给出了一组数字：全球 AI 内容检测平台从 2024 年的约 85 个增长到 2026 年的 247 个，两年增长了 190%，文本检测的平均准确率也从 90.1% 爬升到了 94.3%。

这些 AI 检测工具也不再只是老师抓作弊的帮手，而是不断进化，进入到了更多原本意想不到的地方。

2026 年 1 月，Originality.ai 发布了专为 STEM 学科设计的 Academic Model，用于检测包含代码和公式的学术作业。6 月，公司又发布了 Moodle 插件，让教育机构能将其 AI 检测和查重功能无缝集成到教学管理系统中。

此前专注于文本检测和查重的 Copyleaks，也在今年 6 月份也进入了 AI 检测赛道，推出了一款企业级 AI 视频检测工具，能够对视频文件的视觉和音频轨道进行同时扫描，精准识别 AI 生成内容出现的具体时刻。

教育场景只是起点，但远不是终点。这些产品迭代的背后，还有一道更深的推力在发挥作用——AI 合规。

随着 AI 生成内容越来越逼真，效率提升的另一面，是风险的同步增长。近两年，利用 AI 换脸和语音克隆实施的诈骗案件明显增多，福建一位企业负责人被伪造的 " 好友 " 视频骗走 430 万元，全国政协委员靳东在今年两会期间也披露，有老人因 AI 伪造的人脸和声音被骗走 27 万元养老钱。

诈骗的蔓延加速了监管落地。2025 年 3 月，《人工智能生成合成内容标识办法》发布，要求所有 AI 生成的文本、图片、音频、视频添加显式和隐式标识。2026 年 6 月，短视频平台全面上线 AI 生成内容标注标签，未标注的内容不予分发。国际市场上，美国联邦贸易委员会目前已依据《TAKE IT DOWN Act》对 AI 深度伪造内容进行执法，欧盟《人工智能法案》第 50 条关于 AI 标识的透明度义务也将于 2026 年 8 月 2 日生效。

而这还仅仅只是开始，未来的合规监管一定会更具体、更严格——哪些场景必须标注、哪些场景禁止使用 AI 生成、平台承担多大的审核责任，都将会有更明确的规定。当这些规定逐步落地，AI 检测就不再只是学校的工具，而是内容平台、媒体机构、广告公司、金融机构等各行各业都离不开的基础设施。银行需要确认客服电话那头是真人还是克隆语音，新闻媒体需要核实一段现场视频有没有被 AI 篡改，招聘平台需要验证求职者的视频介绍是不是本人拍摄的。

一边鼓励用 AI 提效，一边检查哪些东西用了 AI。AI 检测这件事，看似和拥抱 AI 的大趋势背道而驰，但实际上并非是传统意义上的倒退。当一个技术能以假乱真的时候，区分真假就是对更多人负责。学生可以用 AI 辅助学习，但论文需要证明是自己写的，这关乎教育公平。企业可以用 AI 生成营销素材，但产品宣传视频不能靠捏造不存在的功能欺骗消费者。普通人刷短视频时，更有权知道屏幕里的内容是否是真实存在的。

AI 生成的内容越多，真假就越难分辨，AI 检测工具的角色也就越清晰：它不是在限制 AI 发展，而是在为这个快速膨胀的世界标出必要的边界。边界之内，AI 可以自由生长；边界之外，有些东西必须属于人类。看似矛盾，实则是技术演进到一定阶段必然会出现的制衡。

这个世界已经离不开 AI，也更离不开能分辨 AI 的人。这也是为什么一个充满矛盾的赛道，会越走越宽。

宙世代

一起剪

相关标签