想当年,打字还是个技术活,五笔高手简直就是办公室里的神。现在呢?随便找个角落,对着手机一顿叨叨,文字就咻咻咻地出现在屏幕上,简直不要太爽。
现在的输入法,能听懂南腔北调,甚至各国语言,语音输入法已经成了我们手机里的标配。但问题来了,市面上这么多输入法,都吹自己识别率最高,到底哪个才是真功夫,哪个又是 " 嘴强王者 "?

不服跑个分,老狐今天就来当一回语音质检员,把市面上最火的五款输入法:讯飞、百度、搜狗、微信、豆包——拉出来遛遛,全方位无死角地给它们来一次期末大考。
测试方法
首先输入法目前都是安装的最新版的(截止撰稿时),使用新的手机号登录。保证公平公正。所有输入法版本号如下:
微信输入法:安卓版 2.2.5
搜狗输入法:安卓版 12.24.3
百度输入法:安卓版 13.1.3.39
讯飞输入法:安卓版 15.0.2
豆包输入法:安卓版 1.0.0.14
工欲善其事,必先利其器,为了保证公平公正,我准备了两台手机,一台播放台词用,一台用于收音并通过输入法输出文本。
播放手机:小米 11 Pro
收音手机:一加 13
在线音源:普通话(BV1hLALefErF)、港普(BV1gZVGzuEpp)、粤语(BV1Jy4y167JB)、英语(BV1hZ42177pn)、中英(BV13XmNYfEjR)
所有的测试,我们会把两台手机并排靠在一起,播放同一个网络音频片段(为方便阅读,下文会把在线的视听片段上传到文中)。

检测方法:WPS 12.1.0.23542 32 位 + 人工检测
WPS 自带比较功能,检测前,每一个测试的原文本我会自己做一版 " 标准版 ",然后通过 WPS 的 " 比较功能 " 标出各输入法的语音输入版与我的标准版进行对比。之后再进行人工比对,记录错误数。
在本次测试中,我将会从文字以及标点两方面进行评分。
文字与标点是我们所有文案组成的最关键的两个部分,文字代表着我们表达的根本意思,而标点则代表着我们文案的意群、情绪等相关信息,均会影响我们的理解。
所以,在本次测试中,为了让结果更直观,我会用一个 " 加权准确率 " 来打分,公式是这样:
总分 = ( 总字数 - 文字错误数 × 1 - 标点错误数 × 0.5 ) / 总字数
文字错误的系数,我这边设置为 1,因为文字错误会极大程度地影响我们对文本的理解,所以系数会更大;而标点系数,我设置为 0.5,相对于文字,很多时候,标点错误对我们文本理解影响会小一点,所以系数会小一点。
好了,废话不多说,Let's Go!
普通话测试
第一关,刚开始肯定是做一些比较简单的测试,上来先来一个普通话的考验。
新闻联播的发音自然是全世界普通话最标准的音频,对于任何语音输入法来说都是基础中的基础。我选取了关于《哪吒 2》的一小段内容,算上标点一共 217 个字数。
1、微信输入法

结果有点意外,微信输入法只错了标点符号,而且这个标点符号基本无关紧要,问题并不算大。
2、搜狗输入法

搜狗出现的错误,主要还是中文 " 二 " 和阿拉伯数字 "2" 的差别,但意思理解上也基本正确。
3、百度输入法

百度输入法, 出了一个小错误,在文中多了个 " 你 ",但也是基本满分。
4、讯飞输入法

讯飞这里,不知道为什么," 情况 " 这个词,出现了乱码,变成了 " 情。。况 "。
5、豆包输入法

豆包也是完全没出错,理解完全正确的。
这段内容并不复杂,几乎所有输入法都能达到不错的表现,最常见的一些错误,主要在于中文字和阿拉伯数字的区别,不过这并不影响意思,所以并没算入分数。
其次,由于全部输入法都没在《哪吒 2》中加入相应的书名号,所以导致整篇识别下来,5 个输入法都是符号错误占比更大,这点非常有意思。
在标准普通话环境下,各家都是学霸级别,得分上:微信>豆包>百度>搜狗>讯飞。

港普测试
简单的普通话测试已经算完结了,接下来,对于口音普通话,肯定也要试一下。毕竟全国各地都有自己的方言,仅仅是普通话,就不知道带了多少种口音。
老狐我选择的带口音的普通话,是 " 港普 "。主要是老狐在广州,就算是港普也能听懂。
我选取了港剧《栋笃神探》的一段内容进行测试。
因为这里面的港普,粤语口音集中,但整体不算差,正适合测试,字符共 161。
1、微信输入法

对于微信来说,港普看来并不简单,很多地方都识别错误了。

搜狗时不时会有断句出错,整体错误率明显上升。
3、百度输入法

百度更离谱了,一开始完全识别不出来。本来我还想着看来这个要零分了,谁知道在一个断句平息之后,它却能重整再次识别,只能说发挥非常不稳定。
4、讯飞输入法

相比前面的兄弟,讯飞在港普中明显有着不错的效果,很多话语都能直接翻译出来,效果不错。
5、豆包输入法

豆包输入的港普辨识也很不错,基本都能辨析出来,但是偶尔还是会有一些短句错误,这个可能不能怪豆包,只能说发音确实不像是普通话。
不得不说,对于香港人来说,普通话确实是噩梦,而对于输入法来说,港普也同样是噩梦。
这段充满港风的塑料普通话,对输入法的口音适应能力是个大考验。最差的两个学生,搜狗和百度,两者的文字错误数都达到 60 个以上。
而在港普环节,讯飞和豆包都拔得头筹,看来口音并不能成为他们的难题。得分上:豆包>讯飞>微信>搜狗>百度。

粤语测试
第三关,主要还是测试输入法方言。选取的,自然还是粤语,一个还是老狐我懂粤语,起码能检测结果,另一方面则是粤语在全球的使用人数较多,也是非常值得拿出来测试的方言之一。
我要用的是一段周星驰电影《鹿鼎记》的台词来进行测试。
这段主要是周星驰扮演的韦小宝的台词,中间有快有慢,而且有非常多粤语特有的词汇,所以用来测试输入法对粤语的熟悉程度正好刚好,字符 185。

微信输入法错得不算多,能感受到,它是确实懂粤语的。

搜狗的表现非常差,一上来就几乎识别不出来,后面即使能识别,也只有只言片语。

百度这段,正确率已经剩下 19.27%,足以让我怀疑,这是不是本身就不太会粤语。

讯飞是非常出乎我意料的,在刚才的港普环节,飞讯的表现可是相当亮眼,本来以为是老狐我设置错误,但在我确认几次,确实选择的是粤语,同时测了 2-3 次之后,发现效果依然拉垮。

最后出场的豆包,可以说是粤语里的优等生,而且也让我十分意外。粤语里的优等生,最让我没想到的是竟然是豆包。
不仅几乎所有输入都能准确识别,而且一些难点也能正确识别,例如说粤语的 " 咁 " 和 " 噉 ",两者发音很相似,甚至很多两广地区的人都会经常混淆,但豆包竟然能正确使用,这是非常让人意外的。
这关可以说是把所有的牛鬼蛇神都测试出来了。现在语音输入,基本每个输入法都会说自己能 hold 住方言,但经此一役,差距很容易就能看出来。
首先说差生,刚才在 " 港普 " 表现最差的百度和搜狗,这次依然毫无意外地表现不怎么样。大段大段地错误。其次让我非常意外的是,讯飞在粤语输入里同样非常拉胯。
整体表现,豆包和微信都很不错,正确率在 90% 以上,是 TVB 的忠实观众,如果你经常需要用粤语交流,选它俩准没错。得分上:豆包>微信>搜狗>讯飞>百度。

英语听力
除了中文以外,这次的测试里面,我还加入了英语。毕竟在外语里面,我们日常生活中碰到英语的情况并不少见。
我挑选了一段发音清晰,语速适中的 TED 演讲,来做测试,单词数在 100 个以上。

微信在英语上辨识还不错,主要是一些因标点符号造成的标点符号问题。
2、搜狗输入法

搜狗的表现也不错,整体错误率并不高。

百度在错误率上明显比前面的输入法都高,整体下来,感觉百度都没有特别多的亮点。

相比粤语,讯飞在英语上表现非常不错,整体效果很好。
5、豆包输入法

豆包依然能展示出非常强的语音输入能力,甚至有一个单词 "Googled",是 google 的变形,都能根据上下文自行推断出来。可以肯定的是,豆包这边肯定有 AI 大模型进行辅助语音输入。
英语里面,每一个单词都算一个字符。同时,由于单词的拼写会有非常多的细节,这些细节都会影响到整体的意思,所以例如像大小写、时态这些,只要有错误,我都会算作一个计算。
英文识别能力上,准确率都非常不错,更准确的对比来看,讯飞、豆包、搜狗,准确率都能在 90% 以上,第一梯队。
得分上:豆包>搜狗>讯飞>微信>百度


中英夹杂
最后测试的,是中英文的混杂。在日常生活中,这种情况虽然很少,但假如真的要完全使用语音输入的话,那中英混杂确实是会遇到的场景。
这里我采用了《欢乐颂》中,舒展在餐厅里中英文夹杂装 X 的名场面,字符在 156 个。

微信的发挥依旧,中规中矩,英语上错得比较多。

搜狗能识别一定的中英文,并且在两者之间无缝切换,连大小写都处理得很好。

百度的识别率明显被狠狠甩在后面了,不仅单词错得多,而且时不时还会出现中文的错误。

在中英文上,讯飞在英文识别似乎并没有十分优秀,很多英文单词,都被生硬地用中文给替代了。

比较突出的是豆包。在这段语音里面,演员为了突出效果,会把台词中的 "fresh" 特意说成 "flash"。但豆包硬是联系上下文,把原意揣摩了出来,帮演员的错误单词发音给 " 纠正 " 了。
很明显,在中英混合的这个留学、白领技能上,豆包和搜狗依然能以微弱的优势领先。
得分上:豆包>搜狗>微信>讯飞>百度

综合结果
最后是将今天的这次结果做一个综合性的总结。
我们今天一共测试了 5 个项目:普通话、港普、方言(粤语)、英语、中英文夹杂。5 个项目取平均值,最终结果如下:

经过我的这轮测试,最终各输入法的准确率如下:
豆包输入法>微信输入法>搜狗输入法>讯飞输入法>百度输入法
可以说,自身动手测试出来的结果,还是有一点出乎老狐意料的。
有的输入法其实推出并不久,但最后出来的结果却非常让人满意,只能说不仅仅是输入法,这些年来,AI 的出现确实让各界都有了巨大的进步。
也有的输入法似乎过去名声很不错,但这些年似乎越来越退步了,以至于让后来者逐渐追上。

当然,本次测试并不代表绝对,虽然老狐我已经用了较为严谨、硬核的测试方法进行实测,但肯定存在各种没有考虑周到的因素以及误差,希望大家可以客观看待,毕竟这种测评吃力不讨好,大家都可以在评论区客观交流讨论。
总而言之,没有绝对的 " 最好 ",只有 " 最适合 "。希望这次的体验,能帮你找到那个最懂你的语音输入法。


登录后才可以发布评论哦
打开小程序可以发布评论哦