量子位 2025-12-20
ChatGPT文风,原产地肯尼亚
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_renwen1.html

 

ChatGPT 文风奇怪的原因(俗称 AI 味儿很浓)找到了!

肯尼亚作家:都是跟我们学的。

就在最近,一位肯尼亚作家的 " 控诉贴 " 登上 Hacker News 热榜——

我是肯尼亚人。不是我的写作风格和 ChatGPT 一样,而是 ChatGPT 写作风格和我一样。

一点进去才知道,原来这位朋友连续精心撰写的好几篇文章都被退稿了,而且理由还都是 " 太像 ChatGPT"。

emmm ……一想到自己从小接受的教育都是 " 文章必须像一座完美的大厦 "、" 你必须展现丰富的词汇量 ",而现在却被误认为出自 AI,这位朋友实在忍不住发出怒吼:

对于那些热衷于侦查数字虚假性的侦探们,我想说:朋友,欢迎来到肯尼亚教室、会议室或公司内部 Teams 聊天室里一个典型的星期二。你们所认为的机器指纹,实际上却是我们教育的化石记录。

而且很早就有消息指出,为了节省人力成本,很多 AI 模型厂商会把 RLHF 这类工作交给非洲人,所以模型的很多用语习惯也会偏向非洲那边。

所以我们有理由怀疑,难道 ChatGPT 真是从肯尼亚 " 偷师 " 写作技巧的?

咱这就火速围观一下——

"ChatGPT 无意中在模仿我们 "

事情是这样的。

来自肯尼亚的 Marcus Olang ’(以下简称小马)最近发文控诉,从年初收到第一条回复开始,他就陷入了需要 " 自证不是 AI" 的困境中。当时甲方给的回复是:

你写的挺好,逻辑也扎实,就是……能不能用更 " 像人 " 的方式重写一下?现在这个感觉,有点太像 ChatGPT 写的了。

而且不止是他,他身边的很多作家朋友也都收到了类似反馈。

而在仔细对比了自己和 ChatGPT 所写内容之后,小马最终无奈发现——别说,你还真别说,咱们的文风确实很像 ChatGPT

从某种意义上说,指控者并非完全错误。我的写作风格确实与大语言模型的输出结果有几分相似。

我们都倾向于使用结构严谨、平衡的句子。我们都喜欢使用过渡词,以确保逻辑流畅。我们都会偶尔使用(如今看来似乎成了罪证)连字符、分号或破折号来连接相关的想法,使其比简单的句号更显优雅。

不过在小马看来:

讽刺之处在于,这种讽刺或许会让我们的祖先会心一笑。

他表示,不是自己写得像 ChatGPT,而是 ChatGPT 无意中在模仿他们——模仿他们这一代,以及过去几代在全球南方,尤其是在像肯尼亚这样的地方,经过严苛教育体系 " 锻造 " 出来的人。

从小到大,小马接受的写作指导都是讲求规范、讲求精心遣词造句(是谁 DNA 又动了?)。

我们从小被教导,文章必须像一座完美的大厦。引言是地基,主体是承重墙,结论是封顶,必须坚固、对称、无懈可击。我们要用 " 首先、其次、最后 " 来构建逻辑,要用 " 此外、然而、因此 " 来精确转折,要用 " 光辉灿烂 "、" 精疲力竭 " 这样的 " 好词 " 来展现词汇量。

这种写作,是我们的敲门砖,是我们在 KCPE(小学毕业考试)决定命运的四十分钟里必须掌握的生存技能,是我们向上攀爬的阶梯。它严谨、清晰、富有说服力,但也因此,在今天某些人的耳朵里,它听起来 " 缺乏人性的温度 "。

而这一套恰巧也被 AI 学去了。

讽刺来了,AI 大模型(比如 ChatGPT)正是从海量的书籍、论文、报告中学习写作的。而这些文本库中,充满了历史沉淀下来的、经典的、正式的书面语——也就是我们被训练去模仿的那种文体。所以,当 AI 为了显得 " 权威 " 和 " 可信 " 而输出时,它的文风自然就与我所受的教育产生了诡异的 " 孪生 " 效应。

所以,如今面对 " 文风像 AI" 的指责,小马愤而吐槽:

这台机器为了显得权威,最终听起来却像个英语作文得了 "A" 的肯尼亚小学毕业考试(KCPE)毕业生。它无意中复制了大英帝国的语言幽灵。

而且他还提到,现存的一些 AI 检测器往往更倾向于将流畅、逻辑严密、句式规整的文本标记为 AI 生成,而这恰恰是许多非英语母语者(尤其接受过严格正式写作训练的人)的写作特点,所以他们也更容易被误判。

总之,小马用自己的亲身经历告诉大家——

由于历史原因,一些非英语母语者的写作,本就是现有 AI 模型的 " 教材 ",而现在他们却成了 AI 普及后的 " 受害者 "

这一说法也纷纷获得了网友们的认同:

不过,令人啼笑皆非的是,小马的这篇感情饱满、" 活人感 " 很强的文章,竟然还是被 Pangram 网站判定为 100% 由 AI 生成。

啊这……小马不语,小马只是一味生气吐血(doge)。

因非洲人做 RLHF,ChatGPT 还爱用 "delve" 一词

而基于类似理由,人们还发现,ChatGPT 似乎对 "delve"(挖掘、深入研究)这个词情有独钟。

《卫报》曾有一篇文章指出,Jeremy Nguyen 这位来自墨尔本斯威本科技大学的 AI 专家发现——

在 PubMed 这类专业学术网站上,"delve" 的出现频率在近几年激增了 10 到 100 倍

(PubMed 主要收录了 80 余国 5200+ 生物医学期刊,总量超 3900 万条文献。)

这暗示了,有大量研究人员可能在用 ChatGPT 辅助写作,并将其偏好的词汇带入了正式学术文本。

这一现象还引来马斯克和 YC 联合创始人保罗 · 格雷厄姆的关注,后者发帖表示:

有人给我发了一封带 "delve" 一词的邮件,而这个词表明文本大概率是 AI 生成的(暗示对方用 AI 写项目书,还要找他投资 hhh)。

并且就在格雷厄姆发帖之后,ChatGPT 官号还用这个词公开整活,继而引来无数网友跟风。

不过,进一步的数据分析显示,"delve" 远非孤例——

像 "explore"、"tapestry"、"testament" 和 "leverage" 等词汇,在 ChatGPT 生成的文本中出现频率也异常地高。

《卫报》在文章中详细揭开了这背后的谜底——

为了将大语言模型 " 驯化 " 成安全、有用、可控的聊天机器人,企业一般会雇佣大量人类测试员,让他们与模型互动并提供反馈(如点赞 / 点踩,或撰写理想的回复)。

模型从这些海量的人类偏好数据中学习,从而调整自己的行为,也即所谓的 RLHF(基于人类反馈的强化学习)。

而出于人力成本考量,RLHF 这项劳动密集型工作被大量外包给了肯尼亚、尼日利亚等英语区的非洲国家。

对这些国家来说,"delve" 这样的词正是他们日常生活中自然、规范的商务或学术英语,因此被高频使用。

所以这些词也就自然在 ChatGPT 中高频出现了。

BTW,你还有哪些小技巧来鉴别某项内容是出自 AI 之手吗?

有网友先给大家打个样了:

" 幼兽般的呜咽 "、" 瞳孔缩成针尖 " ……嗯,一般人属实想不到了(doge)。

参考链接:

[ 1 ] https://marcusolang.substack.com/p/im-kenyan-i-dont-write-like-chatgpt

[ 2 ] https://news.ycombinator.com/item?id=46273466

[ 3 ] https://x.com/JeremyNguyenPhD/status/1780580567215681644

[ 4 ] https://x.com/ChatGPTapp/status/1780721920322781447

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题   扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

  最新最专业的 AI 产品信息及分析  

   不定期发放的热门产品内测码

   内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 肯尼亚 非洲 美的
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论