转行七年后，我曾经的职业彻底被AI颠覆

文 | 白鲸出海

7 年前，作者还是一名职业翻译，用着雅信 CAT 翻译软件，搭配谷歌翻译和纸质的大部头柯林斯字典，做法律文书、技术资料的翻译工作，偶尔也帮一些引进的英语电视节目配字幕。

转行面试的时候，hr 问我为什么不干翻译了，我回答说，感觉自己这个职业可能很快要被 AI 替代了。

当时的 HR 可能以为这只是个随口瞎编的理由，但身处行业中，我的体会真是这样。

2017 年前后，作者明显能感觉到，谷歌翻译的准确率在大幅提升。虽然在一些专业领域，尤其句子结构复杂的文本材料，机翻的结果仍存在很多错误，没法直接采用。但对于一些基础文本，翻译结果已经相当准确、优雅了。

因而行业内也出现了个别译员大范围采纳谷歌翻译结果、敷衍交差的情况，在审校这类稿件时，一旦内容涉及到陌生的专业领域，如果不细看原文，是不容易发现问题的。也就是说，这时候翻译引擎的 " 智力 " 水平，只需配合少许 " 人工 "，就能达到 " 即使胡说八道、也能自圆其说 " 的程度了。

当时我还没注意到，谷歌已经推出了自有品牌手机 Google Pixel phone 和耳机 Pixel Buds，宣传亮点之一，即是通过软硬件结合的方式，让 " 实时翻译 " 这项专业级技能，走进普通消费者的日常生活中。只不过真正的翻译任务，还是通过手机上深度集成的 Google Translate App 完成，Pixel Buds 本身不直接处理翻译逻辑，只单纯扮演一个 " 传声筒 " 的角色。而且，就网络上留存的一些当时的用户反馈来看，产品使用流程比较繁琐，高度依赖手机 APP 和手动操作，且翻译质量和交互体验也差强人意。

左 Google Pixel phone，右 Pixel Buds | Alex Dobie 博客

彼时国内同样掀起了一波人工智能创业浪潮，翻译领域自然也不乏软、硬件科技巨头推陈出新、试图解决用户跨语种交流问题。网易有道、百度翻译陆续采用新的技术路线迭代自家翻译引擎；被誉为 " 中国语音产业第一股 " 的科大讯飞，也于 2016 年年底推出了旗下首款消费级翻译硬件——讯飞翻译机，并迅速成为市场上的明星产品。

2017 年，一家位于深圳的智能硬件初创公司，更进一步提出 " 翻译耳机 " 概念，尝试 " 把翻译软件直接装入耳机 "，让用户实现跨语言自由交流的目标。项目在北美科技众筹平台 Kickstarter 上冷启动，以并不算便宜的价格（超级早鸟价 99 美元），一举收获了 1640 位支持者。这就是如今 AI 同传耳机头部品牌—— Timekettle 时空壶的起点。

图：时空壶初代产品众筹页

几乎每个跨语言交流场景，都有了专属的 "AI 翻译官 "

短短几年，科技飞速发展，日常工作、生活中的大部分难题，似乎都有了产品化的解法，跨语言交流自然也不例外。大语言模型的出现，让普通消费者需要翻译技能的每一个高频场景，都有了专属的 " 翻译官 "。

翻译工种的分类，几个核心要素，一是准确性、二是即时性、三是结果展现的方式。

以作者曾经从事的文本翻译和听译工作为例，两者的共同点，一是对 " 即时性 " 要求不高，工作时间相对充裕；二是都不涉及 " 开口讲 "，只需要把原文本、音视频内容，用另一种语言文字准确转述出来即可。这也是普通消费者日常工作、生活中最常见的场景，包括浏览外文资料、网站，看外文影视节目等等。

通用文本的翻译，目前最佳解决方案，毫无疑问就是大语言模型，以及集成了大语言模型的翻译引擎本身。ChatGPT、DeepSeek、元宝、豆包 …… 现在任何一个大模型的文本翻译质量，基本上都达到了拿来就用的水平；谷歌、微软 Edge 等主流浏览器也提供类似于 " 翻译此页面 " 这样更大众化的功能，为用户浏览外文网站扫除障碍；外文影音内容的翻译，则几乎从 " 源头 " 上得到了解决——市场上主流的视频编辑类产品，几乎把 " 匹配字幕 "、" 字幕翻译 " 做成了标配功能，有的甚至还免费。卡点依然在法律、金融、医疗等对准确度和专业性要求极高的垂直领域，作者就听说过 " 花 5 万块买了一套 AI 智能合同审核工具，结果还得靠人工 " 的案例。

而常见的 " 听译 " 类产品，已经被广泛集成在了各类视频会议、协同办公软件中，以语音转写、会议纪要、实时字幕等形式出现，例如腾讯会议中的 " 字幕和转写 "，飞书 " 妙记 " 的实时字幕功能。就我个人使用体验来看，语音识别的准确度，也就是 " 听 " 的问题，反而比 " 译 " 的问题要大得多。

图：腾讯会议和飞书妙记集成的实时翻译功能

在更专业、更正式、对于 " 即时性 " 要求也更高的视听场景，例如公开演讲、大会论坛，很多会议主办方会将外文演讲者的发言，以实时翻译字幕的形式，投放到会场显示屏上，同步呈现给听众。据作者最近几次参会的切身体验，AI 实时翻译的专业性、准确性已经非常高了，当然也有可能跟预置了专业词库、甚至内部预训练了垂直领域模型有关。

图：Meta 电商海外营销峰会现场，嘉宾用英文演讲，大屏幕右侧以中文同步展示中文字幕

总之，我曾经赖以谋生的饭碗，可以说是被 AI 砸得七七八八了，也不知当年合作过的翻译公司和同行小伙伴们是否还安好。

从 " 对讲机 " 到 " 自由交流 "，AI " 嘴替 " 还在进化

在以上提到的各类场景中，用户更多还是单方面的 " 接收 " 信息，而在需要 " 开口讲外语 " 的场景，就涉及到更高阶的翻译技能——交替传译和同声传译。

交替传译大多出现在外交会晤、外贸洽谈等场景，就像我们常在电视里看到的那样，A 讲话人讲一段，停下来，译员翻译给 B 讲话人；B 讲话人回复，译员再翻译给 A 讲话人，也就是讲话人和译员 " 交替 " 说话。

图：意大利总理梅洛尼与美国总统特朗普会面，两人身侧是双方译员 | 来源：新闻

同声传译则常见于高端会议、一对多发言的场景，讲话人几乎不需要特意停顿，译员通过专业设备收音（除去讲话人声音之外的杂音），最多延迟几秒，即开始同步翻译，声音再通过麦克风，传递到现场佩戴同传耳机的观众耳朵里。

图：联合国总部的全职同声翻译 CHEN JI | 来源：CHEN JI 的 YouTube 频道

过去的同声传译，需要最高级别的专业翻译人才，辅以昂贵的专业设备提供支持。这里的同传设备，主要解决的是通信问题，而非 " 翻译 " 工作本身。而当下火热的 AI 翻译耳机赛道，试图攻克的，就是把同声传译这项技能，从少数 " 高端场景 " 释放，真正拉入到普通消费者的日常工作、生活场景中。

经过 7、8 年的技术攻坚和产品迭代，AI 翻译耳机已从概念阶段真正落地，走向普惠化、消费级，应用场景也从参观访问、商务会谈、跨国会议等商业场景，扩展到了出境旅游、跨文化交流等领域。头部 AI 翻译耳机也由当初 " 对讲机 " 式的交替传译模式，进化到了更接近 " 自由交流 " 式的同声传译模式。

作者测试了时空壶最新一代产品 TimeKettle W4 Pro，发现它已经完全可以应付需要 " 开口讲外语 " 的大部分场景。

这是时空壶 YouTube 官方账号发布的 W4 Pro 的宣传片，很好地展示了在商务场景中，W4 Pro 如何作为跨语言交流的 AI " 嘴替 " 发挥作用。

W4 Pro 提供 5 种工作模式，适配不同的应用场景，可供用户自由切换。这 5 种模式涵盖了上文中提到的所有场景：

1. 影音模式——为音、视频内容实时提供字幕和翻译；

2. 倾听模式——对方说外语，耳机翻译给我听；

3. 发言模式——我说中文，手机外放翻译给对方听；

4. 通话模式——我说中文，电话 /IM 软件对方听到外语翻译；对方说外语，耳机翻译中文给我听；

5. 1v1 双向对话模式——对话双方一人佩戴一只耳机自由交流，耳机同步翻译，更贴近面对面日常交谈的场景。

图：从左至右依次是影音模式、倾听 / 发言模式、通话模式

作为一名前英语笔译，作者虽然可以应付日常英语交流，但在开会、与不同国籍、不同口音的外国朋友交流时，英语能力仍是明显的限制，更不用说遇到其他语种的情况了。如今，AI 翻译耳机这个 " 外挂 "，给了我这样的跨语言工作者极大的信心和助力。

跨语言交流没有 one for all 的最佳解

底层技术的跃迁提升了终端产品的用户体验，也降低了应用落地的门槛。如今市场上涌现出更多 AI 翻译软硬件设备：

许多大厂和初创品牌切入 AI 翻译耳机赛道；让普通蓝牙耳机秒变 "AI 翻译耳机 " 的软件模块惊现华强北；专为翻译设计的各类手持设备、手机、平板陆续上市；AI 翻译眼镜乃至脑机接口等更多创新形态的产品还在路上 ……

作者赞同时空壶创始人田力的观点：" 跨语言痛点是非常大的，散落在非常多的产品里，市场是非常大的，但目前还没出现一个通用型方案，适合所有场景。"

作为最早突破 " 双向同传 " 技术的 AI 翻译耳机产品，时空壶的技术优势在 " 通话模式 " 和 "1v1 双向对话模式 " 中的体验最好，而在 " 影音模式 " 下，同声传译的几秒延迟可能造成的视频 " 音画不同步 "，给用户的体验，肯定是不及内容供给侧的 " 原生配音 " 的。

此外，已有的解决方案还远谈不上 " 完美 "，就如同考试成绩一样，从 90 分提升到 95 分的难度，可能远大于从 60 分提升到 90 分。

比如，如何在在线翻译网络信号不好和离线翻译质量不好之间平衡？如何突破 1v1 场景限制，实现多人流畅地跨语言交流？耳机的形态如何突破 " 私人物品共享 " 的社交障碍？眼镜的形态如何解决不识字的问题 ……

这其中，有的是技术问题，有的可能是工程问题，还有的甚至无关 " 跨语言 "，而是纯粹的 " 交流 " 问题。

田力在近期一次公开谈话中表示，" 因为人的交流的形式，在时间、空间和对象上，就是非常多元和丰富的。不同场景其实是排列组合的一个网，我们从一开始做产品设计的时候就很明确了，时空壶不是为所有的场景服务的。当前为止，其实我们解决的，只是这个排列组合中的一个点，未来，可能是一个产品组合。我期待在未来解决所有场景问题的选手中，时空壶是几个主要的贡献者之一。"

也许未来会像电影《降临》里描绘的那样，有新的文字系统出现，亦或者像小说《三体》中三体文明设定的那样，直接通过 " 思维交流 "，从而彻底颠覆掉人类跨语言交流的模式。但在那之前，作为曾经的翻译从业者、如今的 AI 翻译产品用户，作者自然期待时空壶的使命无限接近于完成——让所有语言不通的人，都可以用母语自然交流、互相理解。

宙世代

一起剪

相关标签