
2012 年,张一鸣给新公司取名,用了一个计算机术语做名字——字节。
这大概是中国科技公司里最让人服气的一个名字。两个字,有技术感,有力量感,认知成本几乎为零。你不需要懂计算机,只需要认中文,就知道「字节」说的是某种文字层面的基本单位。

干净、准确、过目不忘。能拿一个术语做公司名且毫无违和感,这本身就说明这个词翻译得有多好。
现在,「字节跳动」成了全球价值最高的独角兽公司。但要是问你:如果当年那家公司叫「存储单位跳动」,你还觉得那么自然吗?
别笑,这就是最近 AI 行业在发生的事。
别吵了,Token 最好的中文翻译一直在那儿
上周大家对于 Token 该翻译成生什么吵翻天「模元」「智元」「灵符」「令牌」「偷啃」……社交媒体隔段时间就会掀起一轮争论,每次都以各说各话收场。
这些候选词各有各的巧思,但放在一起看,你会发现:大家都在比谁更有灵气、更有意境,却没人先问一个最根本的问题—— Token 在技术上到底是什么?
它不是「智能」的单位,不是「模型」的单位,它是语言处理的最小单位。
其实在这场混战之前,答案早就在那里了。
「灵符」有东方赛博美感,但术语不需要意境,它需要精确。「智元」大气,但 Token 是语言的处理单位,不是「智能」的单位,往上贴「智」字是贴错了标签。「令牌」最离谱,这是 Token 在计算机安全领域的既有译法,特指身份验证凭证,拿来混用等于把银行卡和扑克牌叫同一个名字。「偷啃」这种音译就完全丧失了中文的优势了
在自然语言处理(NLP)学术文献里,Token 作为文本的最小处理单位,长期被译为「词元」。
词,指向语言属性;元,指向最小粒度。两个字,一个管归属,一个管层级。
苹果用了这个译法。打开 Apple 中国官网,Apple Intelligence 的技术页写着「词元响应速度」。

要知道苹果的中文本地化团队是出了名的较真—— AirDrop 叫「隔空投送」,Live Text 叫「实况文本」,每个词都是反复推敲的结果,目标只有一个:准确、简洁、有造词美感。
苹果选了「词元」,绝不是心血来潮。无独有偶,在央视新闻节目里,Token 同样被译作词元。
当苹果和央视不约而同选了同一个中文翻译,其实已经形成了事实标准的雏形,只是差更多人开口。
翻译界有句老话:好的翻译不是发明,是发现——发现那个本该如此的中文表达。
APPSO 认为,词元是唯一一个同时满足信、达、雅三个标准的翻译。 它准确(信),一看就懂(达),有术语的凝练和古典感(雅)。
这场争论,其实没什么可吵的。
「提示词」, AI 时代最将就的翻译
Token 的问题可以收场了。Prompt 的问题,才刚刚开始。
目前业内通用叫法是「提示词」。三个字,好懂,传播也广——但说实话,这个词不够用,早就不够用了,只是没人较真去捅破这层窗户纸。

「提示词」的问题不在于它翻译错了,而在于它把「提示」把权力关系翻反了。
你写一段 system prompt,定义模型的人格边界,规定它只能做什么、不能做什么,指定输出格式和语气——这叫「提示」?这是在下令。
「提示」暗含的逻辑是:模型是主角,人在旁边小声提醒它一下。但真实的权力结构恰恰相反,是人在驱动模型。一个译名把主语关系弄反了,这就不只是措辞问题,是认知框架问题。
「词」字还把格局说小了。 现在的 prompt 早就不是一两句话的事。Anthropic 内部的 system prompt 有几千字。企业级 RAG 应用里,一条 prompt 可能塞进了整本产品手册。用「词」来描述这个东西,就像用「便签」来形容一份合同——你也没说错,但你说小了。
而且你看像素、字节、词元,清一色两个字。两字词在中文里天然带有凝练感,是能进教科书、进国标文档的形态。「提示词」三个字,更像是技术社区里约定俗成的口语简称,不像一个严肃的技术命名。
好比当年把 byte 翻成「存储小段」、把 pixel 翻成「图像色点」,不是不能用,是将就。
「提示词」就是 AI 时代最将就的翻译之一。
「文令」 Prompt
APPSO 的提议是:Prompt,应该翻译为「文令」。
说理由之前,先说这个词怎么推敲出来的,过程本身就是最好的论据。
最初我们想到的是「句令」。句,成句的文字;令,命令、指令。古典美感十足,读起来也响亮有力。
但仔细想有个漏洞:「句」暗示 prompt 是「一句话」。现实中,prompt 可以是一个词,可以是三段话,可以是五千字的系统指令——「句」给了它一个不存在的边界限制。
如果换成「文」,这个问题就消失了。
一字,是文字。一句,是文句。一段,是文段。一篇,是文章。不管 prompt 长成什么样,「文」都接得住,没有边界焦虑。

于是定了, Prompt 就是文令。
文——文字、文本、文章。Prompt 的载体永远是文字,不管是闲聊一句还是 Agent 编排指令,物理形态就是文。「文」不是修饰,是对 prompt 本质形态最直接的命名。
令——命令、指令。Prompt 的功能是驱动模型执行。写下一段文字,模型照着意图去生成、推理、行动。「令」精准地捕捉了这个动作——人在向模型发号施令。
文 = 它是什么(形态)。令 = 它做什么(功能)。
两个字,一个管形态,一个管功能,各司其职,合起来刚好是 prompt 的完整定义。
像素 · 字节 · 词元 · 文令,一条从机器通往人的路
把「文令」放进更大的坐标系里,会看到让人心跳漏半拍的东西:
像素(pixel) → 眼睛看见的世界的最小单位
字节(byte) → 机器存储的世界的最小单位
词元(token) → 模型理解语言的最小单位
文令(prompt) → 人类驱动模型的最小单位
四个词,同一套构词逻辑:载体属性 + 功能属性。
像素——像(图像)+ 素(元素)。
字节——字(文字)+ 节(片段)。
词元——词(词语)+ 元(原始单位)。
文令——文(文字)+ 令(指令)。
像素离机器最近,文令离人最近。这背后有一条隐藏的一条进化时间线:从感知,到存储,到理解,到驱动——这是人类一步步将意图注入机器的完整进程。
相反,如果把「提示词」放进这个坐标系就会格格不入,它描述的是功能,不是定位,和其他三个词不在同一个维度上,因为它的造词逻辑从一开始就跑偏了。

「人工智能」的遗憾,不要再来一次
当然有人会说,叫什么无所谓,大家看得懂就行。
多年前,大概也有人这么评价「像素」和「字节」。但今天,这两个词已经成了全民词汇。你妈妈可能不知道 pixel 的英文拼写,但她一定知道手机摄像头「五千万像素」。
好的术语翻译,是认知基础设施。 它决定了一个技术概念能不能从专业圈层穿透到大众理解。
AI 时代的术语翻译窗口不会一直开着。一旦某个词在社交媒体、教科书、产品说明里固化下来,就很难再改了。
现在还来得及。
你看「黑客」的负面含义在中文里就被彻底固化,结果我们不得不另造一个「白帽子」来打补丁。
「人工智能」这四个字本身也不够好——「人工」天然暗示「假的、模拟的」,但这个翻译已经彻底定型了,没有人有能力再改。「电脑」和「计算机」到今天还没统一,还要再吵多少年不知道。
所幸,Token、「提示词」还没有彻底固化。它还在微信群和自媒体里流通,但还没有被写进国标,没有被教科书锁死。现在提出「词元」「文令」,是成本最低、阻力最小的时候。
现在 「词元」(Token)已经被开始被写入工资单,成为薪酬福利一部分。再等两年,当「提示词」出现在高考题的阅读理解里、出现在劳动合同的岗位名称上,那时候再说就没用了。
APPSO 不想再经历一次「人工智能」式的遗憾,明明有更好的答案,只是没人在窗口还开着的时候大声说出来。
词元、文令:请跟我们一起说
Token 就叫词元。词,定其形。元,定其根。
Prompt 就叫文令。文,定其意。令,定其魂。
这是 APPSO 的主张,也是 APPSO 的邀请。
我们不是要定义术语。 术语由每一个在文章里写它、在发布会上说它、在课件里用它的人定义。我们做的事,只是在窗口关闭之前,把一个更好的选项摆上桌面。
像素让机器把画面给人看。
字节让数据在机器之间流动。
词元让模型读懂人类的语言。
文令让人类的意志驱动机器的智能。
下一次你打开那个对话框,写下你想让 AI 做的事——
你写下的每一个字,都是文令。


登录后才可以发布评论哦
打开小程序可以发布评论哦