多些基于彼此「听懂」的相互理解,是重建以善为经纬的巴别塔的应有之义。
文 | 佘宗明
假如人类语言相通,世界将会怎样?
《圣经》中就讲了个故事:说着相同语言的人类想建造通天塔,借此直通天堂,此举激起 God 不满,视此为挑衅的他,变乱人们口音,增加沟通障碍。因语言不再相通,人类隔阂丛生,无力再造巴别塔。
尽管人类的语言并不相通,但通过翻译消除隔阂的尝试却未曾断绝。
78 年前,也就是在世界第一台现代电子计算机 ENIAC 问世的第二年,「信息论先驱」韦弗就提出了用计算机进行语言翻译的设想。两年后,他在《翻译备忘录》中正式提出机器翻译的概念。
只不过,在有生之年,他并未看到机器翻译迎来历史性突破。
机器翻译迎来奇点时刻,是在十多年前。点燃引线的,是当今 AI 界的重量级人物——人称「AI 教父」的杰弗里 · 辛顿。2006 年,辛顿改善了神经网络优化过于缓慢的致命缺点,使得基于神经网络与深度学习的机器翻译成为可能。
可即便是辛顿本人都未必能料到,他能在大洋彼岸亲自见证机器翻译迎来的节点性时刻。
7 月 26 日,辛顿现身 2025 世界人工智能大会(WAIC)发表了主题演讲。演讲完后,中国外交部原副部长傅莹与辛顿在会场外偶遇。二人的对话虽是主论坛外的插曲,却也为这场技术盛宴增添了耐人寻味的注脚。
傅莹说:「杰弗里,今天你的演讲我听得非常清楚,屏幕上有实时中文翻译字幕,AI 一直在翻译你的话。」
辛顿略显意外:「我看不到屏幕,但我耳机里听到的是人工翻译。」
傅莹回应:「所以,AI 在聆听你。(AI is listening to you!)」
AI 站在身为诺贝尔奖与图灵奖双料得主的辛顿身后,倾听并转译他那些深邃洞见,这本就是 AI 对 AI 世界「推门人」的友善回应。
而几乎秒反应式「听懂」辛顿的中国 AI,也在定义另一种可能。
01
AI 正让机器同传从「可用」到「好用」
消除人类因语言不通而来的隔阂,在故事里是宏大设定,在现实中却对应着颇显急切的刚需:在出境游、跨国会议、跨境贸易、商务谈判等已成「地球村」日常的当下,跨语言沟通变成了高频需求。
可多年来,机器同传在高端国际会议上却只能扮演「打辅助」的角色:延迟久、术语错译率高、专业语境断句混乱,使得主办方通常只敢把 AI 字幕当辅助参考。
但 AI 使得机器翻译驶入了快车道。近些年,无论是国内的科大讯飞、阿里、百度,还是国外的 OpenAI、谷歌、Meta 等,都在发力跨语种翻译技术。
原因不复杂:更符合人类表达习惯的语音交互被认为是下一代人机交互形态,构筑「语音到语音」的闭环体验成了许多大模型打造多模态能力的重要落点。
而语音同传是其中特别考验技术和拉练能力的应用场景,补足即时传译能让大模型实现能力跃升——比起语音来语音去,不同语言间的「实时语音 + 实时翻译 + 实时输出」要难多了。
这其中,作为「AI 语音之王」的科大讯飞,就将机器翻译从传统模式下的「语音→文字→翻译→文字→语音」五段跳,带到了「边听边说的语音到语音同传」阶段,带动了实时语音同传技术的成熟化。
成为本届 WAIC 唯一的「翻译合作伙伴」,将语音同传技术应用于开幕式及多场论坛(包括辛顿的主旨演讲环节),就是对科大讯飞技术实力的「盖章」。
没什么理所应当,所谓理所应当都是种瓜得瓜:正是科大讯飞把中英同传首字响应压缩到 2 秒以内,达到了人类顶尖同传译员的反应速度,将机器同传从「可用」推向了「好用」。
快是壁垒,超强理解力是绝技。辛顿的演讲内容横跨 AI 发展史、认知科学、科技伦理、人类未来、量子计算隐喻等复杂领域,但本次辛顿演讲的中文字幕体验却极为流畅,几乎达到了「无感」的程度,翻译呈现效果可谓质的飞跃。
这离不开讯飞星火语音同传大模型的支撑。就在大会前一天,科大讯飞发布了深度推理大模型星火 X1 的最新版本。端到端架构,130+ 语种的交互问答、数学解题、文本生成、语言翻译等任务,覆盖超 8 万个垂直领域的专业词汇,使得其可以胜任高难度的「倾听」任务,并彻底消除翻译时的卡顿体验。
到头来,星火 X1 带来的无障碍沟通效果,在参会者对大会字幕「几乎忘了是 AI 完成的」评价中可见一斑。
02
15 年前,科大讯飞就是辛顿的「知音」
如果说现场效果显示了「能做到怎样」,那技术沉淀则回答了「为什么能做到这样」。
辛顿那番备受瞩目的演讲被科大讯飞实时倾听转译,本就裹着些许历史回响的意味:一个鲜为人知的故事,将辛顿与这家中国公司十几年前就连接在了一起。
2008 年,当辛顿与华人科学家邓力合作尝试用「深度学习」这个全新方法解决语音问题时,应者一时寥寥,邓力在微软的直属上司就认为这「非常荒谬」。
但,思想火种总会找到愿意接纳它的创新土壤,最终带来燎原效果。
2010 年,邓力受邀回到母校中国科学技术大学,举办了一场关于「深度学习」的学术报告,这启发了台下一群年轻人——他们来自科大讯飞研究院。这批年轻人随后成为微软总部以外全球最早系统了解、发力跟进这项研究的团队之一。
邓力后来就回忆,在那个时代,全球真正相信「深度学习」并付诸实践的公司,只有两家:谷歌和科大讯飞。
这段历史渊源,大致解释了科大讯飞为何能在智能语音领域长期领跑。
《最佳可能的世界:数学与命运》作者埃克朗曾说过:每起事件就像树干,把网状的根伸向过去,把树冠托向未来。如果说偶然之机是栽下种子的触点,那持久之力就是让树冠长得更高的浇灌。
从一个技术追随者,到如今能够为助推了全球 AI 发展的「教父」提供服务,背后就是科大讯飞长达二十余年在多语言技术上的「久久为功」。深耕厚积,蓄积了其跻身人工智能国家队的底气。
拿语音同传来说,科大讯飞首创的基于文本自适应调度的「流式语音合成技术」,就让 AI 翻译出来的声音自然度和拟人感媲美真人。在医疗、制造业、金融这些 「术语重灾区」,覆盖了 8 万 + 专业词汇的星火语音同传大模型,专业内容翻译得分破 90 分,在专业度和完整性上已超越一般同传译员。
这届 WAIC 是自创办以来国际化程度最高的一届全球 AI 盛会,也成了 AI 企业的炫肌肉时刻。星火 X1 加持和多语言能力赋能下的科大讯飞同传会议服务、SaaS 产品和翻译机、录音笔等智能设备密集亮相,就成了中国智能语音领域的全明星卡司阵容。
颇堪寻味的一幕是:在 WAIC 科大讯飞展台前,泰国 AI 公司 Omniscien 的首席技术官 Dion Wiggins 就对多语种 AI 透明屏发出了「This is exciting!」的感叹。
03
世界需要可靠的「第二选择」
需要看到的是,在演讲中,辛顿着重警告了 AI 伴生的风险。风险核心在于,AI 可能发展出人类无法预料和控制的目标。
而大模型作为当前 AI 技术的核心,其价值观和知识边界很大程度上由其训练数据和开发理念所决定。
一个由单一文化背景、单一技术路径主导的全球 AI 格局,本身就蕴含着巨大的「系统性风险」。它可能会在无形中强化某种文化霸权,或是在算法层面忽视特定区域的需求与价值观。
在此背景下,全球需要更多的解决方案来避免这类风险,毕竟,若 AI 大模型成了通往哪里由某个铺设者说了算的单轨铁路,那车上的人注定要承受很多的未卜未知。
而科大讯飞的底座大模型走的就是全栈自研路线:星火 X1 完全是基于「飞星一号」全国产算力平台训练,从底层的 AI 芯片和算力集群,到中间的 AI 框架,再到上层的算法与模型,「全栈自主可控」的技术路径早已成形。
在当前全球地缘政治与科技博弈加剧的当下,这不仅关乎技术实力,更关乎战略安全。当先进制程芯片的获取受限成为常态,全球 AI 产业高度依赖少数几家美国公司的技术栈时,这意味着,将技术迭代的命脉都掌握在自己手中。
鉴于讯飞星火大模型整体效果可对标 OpenAI o3 等国内外一流大模型,其「既能自主,又能领先」的状态构成了它的优势点,也让 AI 多了些安全可控的着力点。
将目光投向更广阔的国际市场时也能看到,科大讯飞作为「第二选择」的价值愈发清晰。
从服务北京冬奥会,到成为进博会和联合国会议的常客,到在 2025 年日本大阪世博会上推出「AI 孙悟空」,再到成为 WAIC 的唯一翻译合作伙伴,科大讯飞的语音同传技术日益成为中国与世界对话的「标准配置」。
对不少非英语国家特别是「一带一路」沿线国家而言,有一个来自中国的技术水平领先且愿意进行更灵活本地化合作的伙伴作为「第二选择」,显然要优于只有一个会带来数据主权与文化安全顾虑的「唯一选项」要好。
就此看,WAIC 上那块精准翻译着辛顿灼见的屏幕,不仅是一次技术实力的展示,更是一次无声的宣言:在关乎人类共同命运的 AI 命题上,一个拥有包容、多元、可靠的「第二选择」的未来,不仅是必要的,而且是可能的。而中国 AI 就在为此提供自己的解决方案。
而今,升级后的星火 X1 已支持超过 130 个语种,为全球跨语言沟通提供了实打实的便利。由此可见,其多语言能力不仅仅是商业布局,更是致力于服务全球多元需求的 AI 力量支撑,有助于制衡单极化的 AI 格局,构建更多元更平衡的全球 AI 生态。
04
结语
辛顿在 WAIC 演讲中直言,「人类面临最重要的事」——加强让 AI 向善的全球合作,防止让 AI「统治」世界。
无论是 AI 向善还是全球合作,都需要打破语言不相通带来的隔膜,增加跨语言沟通的顺畅性。
诗人斯蒂芬 · 格奥尔曾写道:「词语破碎处,无物可存在」。顺畅的跨语言沟通,正是为了缝合那些「破碎处」。
在《巴别塔之后》里,著名学者乔治 · 斯坦纳说:理解即翻译。这话反过来说,很多时候也成立:翻译即理解。或者说,翻译是增进理解的方式。
多些基于彼此「听懂」的相互理解,是重建以善为经纬的巴别塔的应有之义。
科大讯飞提供「第二选择」,用技术搭建全球跨语言沟通桥梁,让更多跨国交流变得无障碍,就是在助力塔基下的人们冲破沟通障碍,更好地聚在一起。
最起码,辛顿演讲被中国 AI 精准实时「听懂」,就让这幅图景变得愈发可期。
✎作者 | 佘宗明
✎运营 | 李玩
欢迎分享到朋友圈
或手机号:18810070968
往期精彩回顾
©
敬请关注
登录后才可以发布评论哦
打开小程序可以发布评论哦