Token 的中文名,看起来终于定了!
今天,中国政府网转发人民日报援引自国家数据局的文章显示,我们日均词元调用量突破 140 万亿。
140 万亿的数据量很夸张,但这条新闻背后的 Token 中文命名更有意思,似乎可以平息最近业界对于 Token 中文名的争议。

这也意味着 Token 的中文名被官方定为 " 词元 "。
国家数据局发布的数据,人民日报发布,中国政府网转发,官方政府机构与官方媒体双重发布,Token 中文名这就算是定下来了。
引爆这轮命名之争的,是腾讯研究院发表的文章中,学者杨斌提出的「模元」译名。一石激起千层浪,各路 AI 大佬在社交平台和行业群组中纷纷给出自己中意的答案。很快,「智元」这个名字浮出水面,并迅速获得广泛认同。
新加坡国立大学校长青年教授、潞晨科技创始人尤洋:
「Token 中文叫做 ' 智元 ',不知道 ' 新智元 ' 创始人是不是时空穿梭回来的。」
自由学者、原清华大学科学史系副教授胡翌霖:
「真不如 ' 智元 '。计算机的单元是字节,Token 是人类智识的计算单元。Token 不是通用计算的概念,是 ' 通用智能 ' 的概念,' 智 ' 比 ' 通 ' 更切中要害。」
百川智能创始人王小川:
「叫做 ' 智元 ' 挺好的。」
资深开源人士陈绪:
「这几天提出了各种 x 元,就觉得智元能打动我,符合信达雅的要求。」
由此引发的大规模讨论,也不乏一些整活儿选手。


但最终,官方拍板,就叫 " 词元 "!
据人民网的解释," 词元 " 是 AI 理解人类语言的最小单位,token 切分出的单位有时是字,有时是词,而词更能覆盖这种范围。



登录后才可以发布评论哦
打开小程序可以发布评论哦