IT之家 13小时前
谷歌发布互译模型Gemini 3.5 Live Translate,谷歌翻译App就能用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 6 月 9 日消息,北京时间 9 日(今天)晚间,谷歌正式发布最新的实时语音互译音频模型 Gemini 3.5 Live Translate,迈出实时翻译的下一步。

Gemini 3.5 Live Translate 可自动识别 70 多种语言,并生成流畅、自然的翻译语音,同时保留说话者的语调、语速和音高

根据介绍,传统轮流式系统通常要等说话者说完后才开始翻译,Gemini 3.5 Live Translate 则会连续生成语音,在 " 等待更多上下文以提升翻译质量 " 和 " 即时翻译以跟上说话者节奏 " 之间取得平衡。整个会话过程中,翻译音频可以保持流畅,避免尴尬停顿,并始终只比说话者慢几秒。

Gemini 3.5 Live Translate 今起陆续登陆谷歌产品:

开发者可通过 Gemini Live API 和 Google AI Studio 使用公开预览版

企业客户可从本月起在 Google Meet 中使用私有预览版

普通用户可通过 Android 和 iOS 版谷歌翻译使用

Gemini 3.5 Live Translate 会在语音流式传输过程中同步处理内容,让跨语言交流更加顺畅。模型可以自动处理多语言输入,无需手动调整设置,抗噪能力也能帮助应用适应嘈杂、复杂和不可预测的环境。开发者可以把 Gemini 3.5 Live Translate 用于多语言通话、会议、课程、直播和广播等场景,提供实时口译体验。

据 IT 之家了解,Gemini 3.5 Live Translate 将登陆全球 Android 和 iOS 版谷歌翻译应用。用户使用实时翻译功能时,只需连接任意耳机,就可以在 70 多种语言中获得更顺畅的翻译,并让译文语音更接近说话者的语气。

Android 用户还将陆续获得基于 3.5 Live Translate 的全新 " 聆听模式 "。用户可以像接电话一样把手机贴到耳边,直接通过手机听筒收听翻译音频。在没有耳机、又不希望旁人听见翻译内容时,这种模式会更方便。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

翻译 谷歌 谷歌翻译 android google
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论