ChatGPT文风，原产地肯尼亚

ChatGPT 文风奇怪的原因（俗称 AI 味儿很浓）找到了！

肯尼亚作家：都是跟我们学的。

就在最近，一位肯尼亚作家的 " 控诉贴 " 登上 Hacker News 热榜——

我是肯尼亚人。不是我的写作风格和 ChatGPT 一样，而是 ChatGPT 写作风格和我一样。

一点进去才知道，原来这位朋友连续精心撰写的好几篇文章都被退稿了，而且理由还都是 " 太像 ChatGPT"。

emmm ……一想到自己从小接受的教育都是 " 文章必须像一座完美的大厦 "、" 你必须展现丰富的词汇量 "，而现在却被误认为出自 AI，这位朋友实在忍不住发出怒吼：

对于那些热衷于侦查数字虚假性的侦探们，我想说：朋友，欢迎来到肯尼亚教室、会议室或公司内部 Teams 聊天室里一个典型的星期二。你们所认为的机器指纹，实际上却是我们教育的化石记录。

而且很早就有消息指出，为了节省人力成本，很多 AI 模型厂商会把 RLHF 这类工作交给非洲人，所以模型的很多用语习惯也会偏向非洲那边。

所以我们有理由怀疑，难道 ChatGPT 真是从肯尼亚 " 偷师 " 写作技巧的？

咱这就火速围观一下——

"ChatGPT 无意中在模仿我们 "

事情是这样的。

来自肯尼亚的 Marcus Olang ’（以下简称小马）最近发文控诉，从年初收到第一条回复开始，他就陷入了需要 " 自证不是 AI" 的困境中。当时甲方给的回复是：

你写的挺好，逻辑也扎实，就是……能不能用更 " 像人 " 的方式重写一下？现在这个感觉，有点太像 ChatGPT 写的了。

而且不止是他，他身边的很多作家朋友也都收到了类似反馈。

而在仔细对比了自己和 ChatGPT 所写内容之后，小马最终无奈发现——别说，你还真别说，咱们的文风确实很像 ChatGPT。

从某种意义上说，指控者并非完全错误。我的写作风格确实与大语言模型的输出结果有几分相似。

我们都倾向于使用结构严谨、平衡的句子。我们都喜欢使用过渡词，以确保逻辑流畅。我们都会偶尔使用（如今看来似乎成了罪证）连字符、分号或破折号来连接相关的想法，使其比简单的句号更显优雅。

不过在小马看来：

讽刺之处在于，这种讽刺或许会让我们的祖先会心一笑。

他表示，不是自己写得像 ChatGPT，而是 ChatGPT 无意中在模仿他们——模仿他们这一代，以及过去几代在全球南方，尤其是在像肯尼亚这样的地方，经过严苛教育体系 " 锻造 " 出来的人。

从小到大，小马接受的写作指导都是讲求规范、讲求精心遣词造句（是谁 DNA 又动了？）。

我们从小被教导，文章必须像一座完美的大厦。引言是地基，主体是承重墙，结论是封顶，必须坚固、对称、无懈可击。我们要用 " 首先、其次、最后 " 来构建逻辑，要用 " 此外、然而、因此 " 来精确转折，要用 " 光辉灿烂 "、" 精疲力竭 " 这样的 " 好词 " 来展现词汇量。

这种写作，是我们的敲门砖，是我们在 KCPE（小学毕业考试）决定命运的四十分钟里必须掌握的生存技能，是我们向上攀爬的阶梯。它严谨、清晰、富有说服力，但也因此，在今天某些人的耳朵里，它听起来 " 缺乏人性的温度 "。

而这一套恰巧也被 AI 学去了。

讽刺来了，AI 大模型（比如 ChatGPT）正是从海量的书籍、论文、报告中学习写作的。而这些文本库中，充满了历史沉淀下来的、经典的、正式的书面语——也就是我们被训练去模仿的那种文体。所以，当 AI 为了显得 " 权威 " 和 " 可信 " 而输出时，它的文风自然就与我所受的教育产生了诡异的 " 孪生 " 效应。

所以，如今面对 " 文风像 AI" 的指责，小马愤而吐槽：

这台机器为了显得权威，最终听起来却像个英语作文得了 "A" 的肯尼亚小学毕业考试（KCPE）毕业生。它无意中复制了大英帝国的语言幽灵。

而且他还提到，现存的一些 AI 检测器往往更倾向于将流畅、逻辑严密、句式规整的文本标记为 AI 生成，而这恰恰是许多非英语母语者（尤其接受过严格正式写作训练的人）的写作特点，所以他们也更容易被误判。

总之，小马用自己的亲身经历告诉大家——

由于历史原因，一些非英语母语者的写作，本就是现有 AI 模型的 " 教材 "，而现在他们却成了 AI 普及后的 " 受害者 "。

这一说法也纷纷获得了网友们的认同：

不过，令人啼笑皆非的是，小马的这篇感情饱满、" 活人感 " 很强的文章，竟然还是被 Pangram 网站判定为 100% 由 AI 生成。

啊这……小马不语，小马只是一味生气吐血（doge）。

因非洲人做 RLHF，ChatGPT 还爱用 "delve" 一词

而基于类似理由，人们还发现，ChatGPT 似乎对 "delve"（挖掘、深入研究）这个词情有独钟。

《卫报》曾有一篇文章指出，Jeremy Nguyen 这位来自墨尔本斯威本科技大学的 AI 专家发现——

在 PubMed 这类专业学术网站上，"delve" 的出现频率在近几年激增了 10 到 100 倍。

（PubMed 主要收录了 80 余国 5200+ 生物医学期刊，总量超 3900 万条文献。）

这暗示了，有大量研究人员可能在用 ChatGPT 辅助写作，并将其偏好的词汇带入了正式学术文本。

这一现象还引来马斯克和 YC 联合创始人保罗 · 格雷厄姆的关注，后者发帖表示：

有人给我发了一封带 "delve" 一词的邮件，而这个词表明文本大概率是 AI 生成的（暗示对方用 AI 写项目书，还要找他投资 hhh）。

并且就在格雷厄姆发帖之后，ChatGPT 官号还用这个词公开整活，继而引来无数网友跟风。

不过，进一步的数据分析显示，"delve" 远非孤例——

像 "explore"、"tapestry"、"testament" 和 "leverage" 等词汇，在 ChatGPT 生成的文本中出现频率也异常地高。

《卫报》在文章中详细揭开了这背后的谜底——

为了将大语言模型 " 驯化 " 成安全、有用、可控的聊天机器人，企业一般会雇佣大量人类测试员，让他们与模型互动并提供反馈（如点赞 / 点踩，或撰写理想的回复）。

模型从这些海量的人类偏好数据中学习，从而调整自己的行为，也即所谓的 RLHF（基于人类反馈的强化学习）。

而出于人力成本考量，RLHF 这项劳动密集型工作被大量外包给了肯尼亚、尼日利亚等英语区的非洲国家。

对这些国家来说，"delve" 这样的词正是他们日常生活中自然、规范的商务或学术英语，因此被高频使用。

所以这些词也就自然在 ChatGPT 中高频出现了。

BTW，你还有哪些小技巧来鉴别某项内容是出自 AI 之手吗？

有网友先给大家打个样了：

" 幼兽般的呜咽 "、" 瞳孔缩成针尖 " ……嗯，一般人属实想不到了（doge）。

参考链接：

[ 1 ] https://marcusolang.substack.com/p/im-kenyan-i-dont-write-like-chatgpt

[ 2 ] https://news.ycombinator.com/item?id=46273466

[ 3 ] https://x.com/JeremyNguyenPhD/status/1780580567215681644

[ 4 ] https://x.com/ChatGPTapp/status/1780721920322781447

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

专属 AI 产品从业者的实名社群，只聊 AI 产品最落地的真问题 扫码添加小助手，发送「姓名 + 公司 + 职位」申请入群～

进群后，你将直接获得：

最新最专业的 AI 产品信息及分析

不定期发放的热门产品内测码

内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

一起剪

相关标签