同声传译被攻陷,谷歌发布 Translatotron 直接语音翻译系统
cnBeta05-16

 

谷歌 AI 官方博客最新博文中向我们介绍了一项实验性质的新系统 --Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本。在博文中写道:"Translatotron 是首个能够直接将一种语言的语音翻译成为另一种语言语音的端到端模型。"

谷歌表示当前的翻译系统分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;最后是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了 Google Translate 等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。

Google AI 软件工程师 Ye Jia 和 Ron Weiss 表示:" 该系统名为 Translatotron,这个系统避免了将任务分成不同的阶段。" 谷歌表示这意味着更快的翻译速度和更少的转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。

更多声音样本访问这里.

以上内容由 "cnBeta" 上传发布

相关标签

谷歌
评论
Yuan H.W.
05-17
需要大量的数据
李世扬
05-16
科大讯飞大涨
Recurring-Fate
05-16
可惜语音识别的日常对话的识别率没想象中高。。。识别本身都不够准确再加上调用并不很智能的谷歌翻译的API 翻译出来的酸爽只有自己懂
Mr_CatX
05-16
alphabet旗下的系列AI已经不是个可以追赶的存在了
早上好有才
05-16
想太多了。同声传译是非常专业的事情…对得起人家的工资
大家都在看
任正非谈谷歌对华为影响:大家都在想办法
IT之家  15小时前
华为拒绝“瘫痪”:自主操作系统很快上线,会让谷歌“生气”
凤凰要闻  18小时前
谷歌的Now Playing可以跟踪您的位置及活动
太平洋电脑网  19小时前
谷歌发布全新企业版AR眼镜 售999美元
威锋网  18小时前
划重点!网络安全等保2.0国家标准宣贯会上,各位专...
51CTO  22小时前
讯飞输入法9.0硬核升级 语音免切换高效输入快人一...
砍柴网  14小时前
互联网流量造假谁的“锅”?利益使然各方皆有责任
砍柴网  8小时前
基特·哈灵顿:说《权力的游戏》烂尾的人可以闭嘴了
cnBeta  10小时前
腾讯信息流产品矩阵日活达1.58亿,企鹅号提出三大...
蓝鲸TMT网  17小时前
官宣丨易代储完成1.2亿元B+轮融资,打造极致产品...
亿欧网  21小时前
利用计算机视觉和卫星图像,Facebook用实时地...
猎云网  45分钟前
与八国争夺7年 亚马逊即将获得.amazon域名
砍柴网  21小时前
要为医生提供看得见的“听诊器”,GE医疗新版掌上超...
36氪  12小时前
天猫导演的618大戏,为何“男一号”选了聚划算?
砍柴网  8小时前