钛媒体 昨天
惩罚好文章的AI检测,逼出一门灰色生意
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 商业 DNA

今年,全国越来越多高校将论文 AI 率的检测结果与答辩资格绑定,具体标准不一,从 15% 到 40% 不等。

至于检测结果从哪里来,准不准确,全是问号。同一篇论文换个平台检测,AI 率能差 20 个百分点。合格与不合格之间,或许只隔着一次平台选择。

为了过关,部分学生把学术论文改得口语化。电商和社交平台出现了 " 降 AI 率 " 服务,一个商家该项服务的累计销量就突破了 4000 件。

灰产只是小事,关键在于判断的标准。有学者指出:学术论文越规范、越严谨,越容易被判 " 像 AI"。因为高质量学术写作的特征,恰好就是大模型训练时偏好的优质语料特征。

当标准如此,系统惩罚的恰恰是那些认真写论文的人。

01 量不准的尺

国内某知名医科大学的研究生陈璐有个观察:自己用大白话写出来的毕业论文,AI 率并不高。

但班上的学霸,硕士课题发表在 SCI 杂志上、影响因子也很高,用同一个课题写出的毕业大论文,AI 率却高达 30%。

" 他们都很无奈,就是因为写得太规范了。" 陈璐说。

这不是孤例。媒体用同一篇测试文本在三个平台检测,知网给出 AI 率 90.2%,PaperPass 给出 95.77%,PaperYY 给出 69.2%,最高和最低相差超过 20 个百分点。

不同平台之间差 20 个百分点,意味着同一篇论文从一个平台换到另一个平台,结果可能从合格变成不能答辩。

学生论文检测数字浮动,经典作品的结果更令人瞠目。有网友把《滕王阁序》和《岳阳楼记》输入同类检测系统,AI 率超过 50%。王勃写的骈文,范仲淹写的名篇,在这套系统面前,和一个研究生熬夜码出来的论文一样可疑。

2025 年,中国人民大学新闻学院副教授董晨宇,将团队耗时 3 年,追踪多个真实案例写成的论文提交至检测平台,被判定 AI 率高达 82.54%。而其中标红的 " 高度疑似 AI 生成 " 段落,恰好是他们最扎实的原创内容。

北京航空航天大学法学院教授裴炜给出了一个关键解释:多数 AI 率检测系统的原理是基于 " 语言预测 " ——分析大量 AI 生成文本,归纳出 AI 的语言习惯,再与学生论文进行比对。

但人类本来也会使用规范、重复的表达,尤其在学术写作这种高度格式化的领域。

" 没有 AI,人也可能做出类似的语词联系和表达。" 换句话说,检测系统不是在判断 " 是否 AI 生成 ",而是在判断 " 是否像 AI 生成的文本 "。

它没有能力区分站在屏幕前的,是一个写得规范的人,还是一台模仿规范的机器。

同济大学法学院互联网与人工智能法律研究中心主任张韬略直言,当前 AI 生成内容检测工具的技术成熟度存疑,若直接用于判定学生学术诚信,可能存在误判风险。

02   被逼出的灰色生意

当一个并不成熟的工具,拥有了学生毕业与否的能力,一切开始失控。

本科毕业生刘风总结出规律:越是逻辑清楚、用词规范,越容易被系统判定为 AI 生成;表达越随意、越口语,反而越容易过关。

她连续四五天对着检测报告改句子," 论文水平没多少精进,精力全耗在应付系统上 "。

具体操作包括把然而改成但,把例如换成比如,把综上所述删掉。有人刻意加了的、啊、呢、哦之类语气词。还有人把句号改成逗号,AI 率居然就此降了 20 个百分点。

更离谱的策略是中英互译,把论文翻译成英文再译回中文,结果专业术语 " 肿瘤微环境 " 变成了 " 身体里的小坏蛋 "。

学生的目的已经不再是写出好论文,而是向 AI 证明自己不是机器。当人需要证明自己是人,游戏规则就已经反了。

而规则正在催生出一条灰色产业链。

一款叫 " 写作狗 " 的系统,号称用 AI 技术对模板化句式做重组,可以将 AI 率从 95.77% 降至 11.3%。截至 6 月 10 日,该服务在淘宝已售出 4166 件,商家称 "90% 的用户降完后都是 10% 左右 "。

在社交平台上," 降手 " 们活跃起来。他们按字数收费,千字 10 元左右。主打 " 纯人工降 AI"。

《法治日报》的记者调查发现,人工只是号称,降手们靠的还是 AI。打开 AI 工具,输入特定指令," 操作快的话,10 多分钟就能改完 "。所谓的 " 降手 ",不过是会用 prompt 的中介。

传统论文代写需要人查资料、写文章,成本高、周期长;而降 AI 率的要低上很多,API 调用成本可能不到几毛钱,几分钟就能交货。也有学者认为,这门生意的利润空间,恐怕超过论文代写。

更值得注意的是,过去买代写的大多是少数不愿写论文的学生。但现在,大量自己认真写论文的学生,因为检测误判,也成了这门生意的被迫买单者。

媒体报道中,有人前后在维普做了 4 次 AIGC 检测、1 次查重,花了近 140 元,在同学中已属偏低。有人在知网反复检测降重花了约 750 元。

学生花钱检测,花钱降 AI 率,再把论文改烂。产业链的每一环都在赚钱,只有论文的质量在滑坡。

03   学术逆淘汰

过去几年,AI 生成的内容越来越多,人们对此的应对也在不断变化。

2023 年 1 月,OpenAI 发布 AI 文本检测工具 "AI Classifier",准确率仅 26%,同年 7 月宣布关闭。

2023 年,美国南佛罗里达大学邀请 72 名语言学专家区分 AI 文本和人类写作,正确率 39%。

2024 年初,福州大学、中国传媒大学等高校陆续发布毕业论文 AIGC 检测通知。

2025 年 5 月,南京大学明确:AIGC 检测结果仅作为学术规范性辅助参考,不作为论文原创性判定依据。

2026 年 5 月,中国学位与研究生教育学会发布《规范研究生学位论文与实践成果中人工智能工具使用指南》,重心从技术检测转向压实主体责任,强调使用声明、过程留痕和答辩质询。

这些反思和回调发生的同时,更多高校在加码。

有些学校已要求本科论文 AI 率不超过 15%,硕士不超过 10%,博士不超过 5%。福州大学规定:查重检测或 AIGC 检测第二次才通过的论文,最终总评成绩只能记作及格。

这意味着学生在跟一个误差高达 20% 的系统博弈。

江西师范大学政法学院颜三忠教授看来," 用 AI 检测 AI,再用 AI 改写欺骗检测 ",这已经构成了一个封闭的荒诞循环。

学生不是在学习如何做研究,而是在学习如何在一套不可靠的规则下生存。

学生为通过检测刻意 " 降 AI 率 ",本质上是被迫对抗技术缺陷,反而降低了论文质量。

上海财经大学特聘教授胡延平说得更尖锐:" 如果有毕业生用 AI 解决了某个重大问题,哪怕 AI 率高达 90%,也应该给他奖励。如果有人堆砌出了 AI 含量为零、但实际价值也为零的文章,即使给他发表空间也是资源浪费。"

几年前,OpenAI 已经因为检测准确率过低关闭了自己的检测工具,72 位语言学专家也分不清人和 AI。今天,AI 却有了决定学生能否毕业的权力。

这套系统里,一天卖出几千单的降 AI 服务,反而是问题最少的环节。

(文中人物皆为化名。)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 答辩 研究生 中国人民大学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论