雷科技 5小时前
中国移动5G新通话实测:云端AI还需打磨,撑得起运营商的AI梦吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

当 AI 开始进入手机相册、输入法、系统助手之后,最传统、也最容易被忽视的语音通话,终于也被运营商重新包装一遍了。

近日,中国移动正式上线 5G 新通话,试图把过去只负责接通的语音服务,升级成高清、智能、安全的一整套通信体验。问题是,AI 通话这件事看起来简单,真正用起来却很挑剔:语音转写准不准、AI 翻译会不会出错以及相比手机自带的功能有没有优势?

这一次,雷科技(ID:leitech)就从通话场景测试出发,看看中国移动主导的 AI 语音升级,究竟能不能带来通信体验的升级。

尝鲜免费,想用得爽得加钱

按照运营商的「传统艺能」,推出增值业务的直接目的往往是增收,用户要用新功能,通常得额外付费。此次中国移动上线的 5G 新通话,包含的具体功能主要有趣味通话、通话字幕、智能翻译、点亮屏幕、AI 速记。由于该服务刚刚上线,兼容性方面还在和不同机型磨合,当下能正常使用的功能主要是通话字幕、智能翻译和 AI 速记。

要使用移动的 5G 新通话服务,首先得开通相关会员,具体包括基础会员、黄金会员和钻石会员。其中,最基础的会员目前免费,套餐内包含每月 60 分钟的通话字幕、10 分钟的智能翻译和 10 分钟的 AI 速记;黄金会员则升级为不限时通话字幕、100 分钟的智能翻译和 100 分钟的 AI 速记,月费 8 元;最高一档的钻石会员通话字幕和智能翻译都是不限时,AI 速记升级到了 300 分钟,月费 15 元。

5G 新通话开通方面,现在还是有一些限制条件的:首先必须是安卓或鸿蒙机型,暂不支持 iPhone;其次手机和号卡得开通了 VoLTE 或 VoNR 服务,即支持高清语音通话,语音通话要通过流量而非传统 GSM,这也是它能接入云端 AI 服务的前提条件。

具体开通这项业务时,需要在中国移动官方 App 中进行。不过,目前这个路径还存在一个 bug,按照官方指引在 App 中以「通话升级服务」为关键词搜索,无法跳转到业务界面;但如果搜索「通话字幕」「智能翻译」等更加具体的功能关键词,则可以成功跳转。

在 5G 新通话界面的「通话设置」选项中,可以对 AI 速记、智能翻译、通话字幕等功能进行设置。比如 AI 速记可以选择具体的行业领域,像法律、科技、体育、医疗等,这就方便了特定职业工作场景下的使用;智能翻译则是可以选择语言,目前支持英语、日语和俄语三种语言和粤语一种方言;而通话字幕支持英语和日语两种外语,方言则有粤语、四川话等。

值得一提的是,虽然 App 内的新通话界面里提供了拨号盘,但对应功能是直接集成到了手机系统中电话 App 中的,并不需要通过移动 App 来实现。另外,在语音通话过程中,用户可以根据提示在拨号盘中输入相应的数字代码来开启或关闭对应的功能,比如 11 是智能翻译、22 是通话字幕、33 是 AI 速记。

整体完成度较高,通话字幕表现一般

我们在一台安卓手机上开通了中国移动的 5G 新通话服务,紧接着就来实测一波,看看这些功能是不是真的好用。

通话字幕:表现一般

首先测试的就是通话字幕,说白了这个功能就是在打电话的时候把双方的语音实时转成文字。实际上,在 AI 技术普及前,语音转文字功能就在很多场景里出现了,只是转录效果通常都不太好,对说话人的口音标准程度、咬字清晰度等方面有很高的要求。

而 AI 对语音转录的助力,体现在能更精准地识别理解相对没那么标准的模糊发音,同时能根据上下文来调整和修正,以提升整体的准确度。中国移动的通话字幕功能,实现的主要难度就是「实时」,要通过云端 AI 在极短时间内给出反馈。

实际测试过程中,我们让另一名小伙伴在电话另一端念一段雷科技之前的评测稿件,然后在通话界面开启通话字幕。从结果来看,它的表现只能说有点一般,大部分字词其实都转录正确了,但一些关键词缺失或转录错了,导致语句乃至整段话变得难以理解。更关键的是,语音通话是双方实时进行的,使用者不太可能停下来自己去脑补和修正字幕的错误。

我们还测试了四川话的语音通话,通话字幕效果还过得去,当然还是有些错误。不过,由于通话是比较生活化的聊天,不像评测稿件那样有相对专业的字词,对 AI 的压力就没那么大。

智能翻译:英译中还行

智能翻译功能可以视作通话字幕的增强版,即在把语音转成字幕的同时,提供另一条翻译字幕。我们实测时发现,如果通话端是比较标准的英文语音,则识别的准确率还是挺高的。不过,部分细节稍微有点瑕疵,比如「I'm fine,Thank you and you?」的后半句显然不能翻译成「谢谢你和你」。

我们还尝试了下让它翻译粤语通话,效果比较一般,问题主要在于不能准确地把一些粤语里的专用词汇理解并转译成对应的普通话用词。比如,粤语里的「系」应该翻译成普通话的「是」,「落火车」应该翻译成「下火车」,但它居然直接原封不动地搬过去。对于这点,办公室里的广东同事都在吐槽。

AI 速记:可用性挺高

AI 速记是现在很多办公、会议软件中一项非常基础的功能,它的作用基本就是把语音信息保存并转成文字,同时会对信息进行归纳总结,并整理成更简洁的摘要。相比实时字幕,AI 速记的准确率通常更高。原因在于,实时字幕更强调边说边出,系统需要在很短时间内完成识别和显示;而 AI 速记对时效性的要求没那么高,可以在通话结束后结合更完整的上下文进行整理、修正和归纳,因此更容易得到准确、连贯的结果。

我们测试时,用了一篇雷科技(ID:leitech)视频内容的音频,通话结束后,移动会发送一条 AI 速记已完成的短信,同时也会保存在云端,用户可以打开移动 App 查看或导出。

整体来说,AI 速记的准确率高了很多,而且 AI 总结概括得也比较到位,能看出它基本理解了整个音频的内容,可用性已经很高了。

运营商的 AI 通话,和终端厂商有何不同?

其实,在中国移动推出 5G 新通话之前,很多手机厂商已经在系统中加入了 AI 通话相关的功能。比如,现在绝大部分国产手机都有 AI 通话助手,它能将语音通话转成文字并概括核心内容,还能提供实时翻译,甚至还能直接帮用户接电话,用 AI 语音来回复对方。

这样看下来,运营商端的 AI 通话和终端厂商的 AI 通话,在具体功能方面其实有些重叠的,只是它们的实现机制有所区别。现在很多旗舰机型,都拥有一定的本地 AI 算力,像 OPPO Find X8 系列就配备了安第斯大模型端侧版,通话一结束,手机会直接调用本地 NPU 算力,在本地提取对话的关键信息并生成摘要文本,这切断了数据上云的路径,从根本上保证了商务电话等敏感信息的隐私安全。

而运营商端并不掌握对用户设备的直接控制权,因此它们实现 AI 通话功能只能通过云端的形式实现。当然,相比其他第三方开发商,运营商控制着电话、信息这类系统级的超级入口,保留着拨号盘指令等「特权」。运营商的 App 只是提供了一个开通服务的入口,AI 通话功能并不需要基于这个 App 实现,用户打开拨号盘、拨出电话就能享受这项服务。

另外,运营商和手机厂商对 AI 通话的商业化路线也很不一样。作为依靠增值业务增收的运营商,中国移动的思路很简单,就是把 AI 通话视作付费业务,用比传统通话更强的 AI 功能来吸引用户付费。

而手机厂商推出的类似功能,则普遍是免费的。也就是说,小米 OV 们的 AI 通话,并不是为了直接增收,更多是出于增强手机产品本身竞争力的考量,说到底是为了带动手机销量增长。

坦率说,对于中国移动这次推出的 5G 新通话,我个人不是特别看好。首先,现在主流手机品牌基本都提供了类似的功能,二者的使用场景是有重叠的;其次,移动这项服务的免费版有很多限制,付费机制本身就会劝退很多人;另外,5G 时代,用户对运营商提供的语音服务需求量在急剧降低,人们更习惯于用微信、QQ 等第三方 App 来代替。

当然,这并不意味着以中国移动为代表的运营商,在 AI 领域的尝试就是没意义的。AI 已经在持续改变千行百业,也对运营商提出了全新的转型要求。

客观来看,运营商的优势在于底层网络无差别的覆盖。毕竟并非所有人都在使用支持大模型的最新旗舰机,对于大量中低端手机或老旧设备用户而言,这种不吃硬件配置、完全依托网络的云端 AI 服务,恰恰是他们体验 AI 便利的最低门槛。

此外,相比于在 C 端和手机厂商内卷,B 端市场或许才是运营商 AI 通话更广阔的舞台。无论是面向政企的 AI 客服,还是跨国商务会议场景,通过打包出售定制化的 AI 通信解决方案,运营商显然更容易跑通商业变现的路子。

总的来说,中国移动的 5G 新通话更像是一次 AI 领域的试水。尽管现阶段面向普通用户的体验仍需打磨,付费模式也不一定能被广泛接受,但作为基础设施提供者,将 AI 能力直接注入通信底层,依然是通信行业迈向 AI 化所必须要走的路。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 5g 中国移动 翻译 日语
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论