7 年前,作者还是一名职业翻译,用着雅信 CAT 翻译软件,搭配谷歌翻译和纸质的大部头柯林斯字典,做法律文书、技术资料的翻译工作,偶尔也帮一些引进的英语电视节目配字幕。
转行面试的时候,hr 问我为什么不干翻译了,我回答说,感觉自己这个职业可能很快要被 AI 替代了。
当时的 HR 可能以为这只是个随口瞎编的理由,但身处行业中,我的体会真是这样。
2017 年前后,作者明显能感觉到,谷歌翻译的准确率在大幅提升。虽然在一些专业领域,尤其句子结构复杂的文本材料,机翻的结果仍存在很多错误,没法直接采用。但对于一些基础文本,翻译结果已经相当准确、优雅了。
因而行业内也出现了个别译员大范围采纳谷歌翻译结果、敷衍交差的情况,在审校这类稿件时,一旦内容涉及到陌生的专业领域,如果不细看原文,是不容易发现问题的。也就是说,这时候翻译引擎的 " 智力 " 水平,只需配合少许 " 人工 ",就能达到 " 即使胡说八道、也能自圆其说 " 的程度了。
当时我还没注意到,谷歌已经推出了自有品牌手机 Google Pixel phone 和耳机 Pixel Buds,宣传亮点之一,即是通过软硬件结合的方式,让 " 实时翻译 " 这项专业级技能,走进普通消费者的日常生活中。只不过真正的翻译任务,还是通过手机上深度集成的 Google Translate App 完成,Pixel Buds 本身不直接处理翻译逻辑,只单纯扮演一个 " 传声筒 " 的角色。而且,就网络上留存的一些当时的用户反馈来看,产品使用流程比较繁琐,高度依赖手机 APP 和手动操作,且翻译质量和交互体验也差强人意。

左 Google Pixel phone,右 Pixel Buds | Alex Dobie 博客
彼时国内同样掀起了一波人工智能创业浪潮,翻译领域自然也不乏软、硬件科技巨头推陈出新、试图解决用户跨语种交流问题。网易有道、百度翻译陆续采用新的技术路线迭代自家翻译引擎;被誉为 " 中国语音产业第一股 " 的科大讯飞,也于 2016 年年底推出了旗下首款消费级翻译硬件——讯飞翻译机,并迅速成为市场上的明星产品。
2017 年,一家位于深圳的智能硬件初创公司,更进一步提出 " 翻译耳机 " 概念,尝试 " 把翻译软件直接装入耳机 ",让用户实现跨语言自由交流的目标。项目在北美科技众筹平台 Kickstarter 上冷启动,以并不算便宜的价格(超级早鸟价 99 美元),一举收获了 1640 位支持者。这就是如今 AI 同传耳机头部品牌—— Timekettle 时空壶的起点。

图:时空壶初代产品众筹页
几乎每个跨语言交流场景,都有了专属的 "AI 翻译官 "
短短几年,科技飞速发展,日常工作、生活中的大部分难题,似乎都有了产品化的解法,跨语言交流自然也不例外。大语言模型的出现,让普通消费者需要翻译技能的每一个高频场景,都有了专属的 " 翻译官 "。
翻译工种的分类,几个核心要素,一是准确性、二是即时性、三是结果展现的方式。
以作者曾经从事的文本翻译和听译工作为例,两者的共同点,一是对 " 即时性 " 要求不高,工作时间相对充裕;二是都不涉及 " 开口讲 ",只需要把原文本、音视频内容,用另一种语言文字准确转述出来即可。这也是普通消费者日常工作、生活中最常见的场景,包括浏览外文资料、网站,看外文影视节目等等。
通用文本的翻译,目前最佳解决方案,毫无疑问就是大语言模型,以及集成了大语言模型的翻译引擎本身。ChatGPT、DeepSeek、元宝、豆包 …… 现在任何一个大模型的文本翻译质量,基本上都达到了拿来就用的水平;谷歌、微软 Edge 等主流浏览器也提供类似于 " 翻译此页面 " 这样更大众化的功能,为用户浏览外文网站扫除障碍;外文影音内容的翻译,则几乎从 " 源头 " 上得到了解决——市场上主流的视频编辑类产品,几乎把 " 匹配字幕 "、" 字幕翻译 " 做成了标配功能,有的甚至还免费。卡点依然在法律、金融、医疗等对准确度和专业性要求极高的垂直领域,作者就听说过 " 花 5 万块买了一套 AI 智能合同审核工具,结果还得靠人工 " 的案例。
而常见的 " 听译 " 类产品,已经被广泛集成在了各类视频会议、协同办公软件中,以语音转写、会议纪要、实时字幕等形式出现,例如腾讯会议中的 " 字幕和转写 ",飞书 " 妙记 " 的实时字幕功能。就我个人使用体验来看,语音识别的准确度,也就是 " 听 " 的问题,反而比 " 译 " 的问题要大得多。

图:腾讯会议和飞书妙记集成的实时翻译功能
在更专业、更正式、对于 " 即时性 " 要求也更高的视听场景,例如公开演讲、大会论坛,很多会议主办方会将外文演讲者的发言,以实时翻译字幕的形式,投放到会场显示屏上,同步呈现给听众。据作者最近几次参会的切身体验,AI 实时翻译的专业性、准确性已经非常高了,当然也有可能跟预置了专业词库、甚至内部预训练了垂直领域模型有关。

图:Meta 电商海外营销峰会现场,嘉宾用英文演讲,大屏幕右侧以中文同步展示中文字幕
总之,我曾经赖以谋生的饭碗,可以说是被 AI 砸得七七八八了,也不知当年合作过的翻译公司和同行小伙伴们是否还安好。
从 " 对讲机 " 到 " 自由交流 ",AI " 嘴替 " 还在进化
在以上提到的各类场景中,用户更多还是单方面的 " 接收 " 信息,而在需要 " 开口讲外语 " 的场景,就涉及到更高阶的翻译技能——交替传译和同声传译。
交替传译大多出现在外交会晤、外贸洽谈等场景,就像我们常在电视里看到的那样,A 讲话人讲一段,停下来,译员翻译给 B 讲话人;B 讲话人回复,译员再翻译给 A 讲话人,也就是讲话人和译员 " 交替 " 说话。

图:意大利总理梅洛尼与美国总统特朗普会面,两人身侧是双方译员 | 来源:新闻
同声传译则常见于高端会议、一对多发言的场景,讲话人几乎不需要特意停顿,译员通过专业设备收音(除去讲话人声音之外的杂音),最多延迟几秒,即开始同步翻译,声音再通过麦克风,传递到现场佩戴同传耳机的观众耳朵里。

图:联合国总部的全职同声翻译 CHEN JI | 来源:CHEN JI 的 YouTube 频道
过去的同声传译,需要最高级别的专业翻译人才,辅以昂贵的专业设备提供支持。这里的同传设备,主要解决的是通信问题,而非 " 翻译 " 工作本身。而当下火热的 AI 翻译耳机赛道,试图攻克的,就是把同声传译这项技能,从少数 " 高端场景 " 释放,真正拉入到普通消费者的日常工作、生活场景中。
经过 7、8 年的技术攻坚和产品迭代,AI 翻译耳机已从概念阶段真正落地,走向普惠化、消费级,应用场景也从参观访问、商务会谈、跨国会议等商业场景,扩展到了出境旅游、跨文化交流等领域。头部 AI 翻译耳机也由当初 " 对讲机 " 式的交替传译模式,进化到了更接近 " 自由交流 " 式的同声传译模式。
作者测试了时空壶最新一代产品 TimeKettle W4 Pro,发现它已经完全可以应付需要 " 开口讲外语 " 的大部分场景。

这是时空壶 YouTube 官方账号发布的 W4 Pro 的宣传片,很好地展示了在商务场景中,W4 Pro 如何作为跨语言交流的 AI " 嘴替 " 发挥作用。
W4 Pro 提供 5 种工作模式,适配不同的应用场景,可供用户自由切换。这 5 种模式涵盖了上文中提到的所有场景:
1. 影音模式——为音、视频内容实时提供字幕和翻译;
2. 倾听模式——对方说外语,耳机翻译给我听;
3. 发言模式——我说中文,手机外放翻译给对方听;
4. 通话模式——我说中文,电话 /IM 软件对方听到外语翻译;对方说外语,耳机翻译中文给我听;
5. 1v1 双向对话模式——对话双方一人佩戴一只耳机自由交流,耳机同步翻译,更贴近面对面日常交谈的场景。

图:从左至右依次是影音模式、倾听 / 发言模式、通话模式
作为一名前英语笔译,作者虽然可以应付日常英语交流,但在开会、与不同国籍、不同口音的外国朋友交流时,英语能力仍是明显的限制,更不用说遇到其他语种的情况了。如今,AI 翻译耳机这个 " 外挂 ",给了我这样的跨语言工作者极大的信心和助力。
跨语言交流没有 one for all 的最佳解
底层技术的跃迁提升了终端产品的用户体验,也降低了应用落地的门槛。如今市场上涌现出更多 AI 翻译软硬件设备:
许多大厂和初创品牌切入 AI 翻译耳机赛道;让普通蓝牙耳机秒变 "AI 翻译耳机 " 的软件模块惊现华强北;专为翻译设计的各类手持设备、手机、平板陆续上市;AI 翻译眼镜乃至脑机接口等更多创新形态的产品还在路上 ……
作者赞同时空壶创始人田力的观点:" 跨语言痛点是非常大的,散落在非常多的产品里,市场是非常大的,但目前还没出现一个通用型方案,适合所有场景。"
作为最早突破 " 双向同传 " 技术的 AI 翻译耳机产品,时空壶的技术优势在 " 通话模式 " 和 "1v1 双向对话模式 " 中的体验最好,而在 " 影音模式 " 下,同声传译的几秒延迟可能造成的视频 " 音画不同步 ",给用户的体验,肯定是不及内容供给侧的 " 原生配音 " 的。
此外,已有的解决方案还远谈不上 " 完美 ",就如同考试成绩一样,从 90 分提升到 95 分的难度,可能远大于从 60 分提升到 90 分。
比如,如何在在线翻译网络信号不好和离线翻译质量不好之间平衡?如何突破 1v1 场景限制,实现多人流畅地跨语言交流?耳机的形态如何突破 " 私人物品共享 " 的社交障碍?眼镜的形态如何解决不识字的问题 ……
这其中,有的是技术问题,有的可能是工程问题,还有的甚至无关 " 跨语言 ",而是纯粹的 " 交流 " 问题。
田力在近期一次公开谈话中表示," 因为人的交流的形式,在时间、空间和对象上,就是非常多元和丰富的。不同场景其实是排列组合的一个网,我们从一开始做产品设计的时候就很明确了,时空壶不是为所有的场景服务的。当前为止,其实我们解决的,只是这个排列组合中的一个点,未来,可能是一个产品组合。我期待在未来解决所有场景问题的选手中,时空壶是几个主要的贡献者之一。"
也许未来会像电影《降临》里描绘的那样,有新的文字系统出现,亦或者像小说《三体》中三体文明设定的那样,直接通过 " 思维交流 ",从而彻底颠覆掉人类跨语言交流的模式。但在那之前,作为曾经的翻译从业者、如今的 AI 翻译产品用户,作者自然期待时空壶的使命无限接近于完成——让所有语言不通的人,都可以用母语自然交流、互相理解。


登录后才可以发布评论哦
打开小程序可以发布评论哦