IT之家 昨天
阿里通义Qwen3-TTS语音合成AI模型发布,支持超49种音色
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 12 月 10 日消息,阿里通义千问今日发布 Qwen3-TTS,这是一款支持多音色、多语种和多方言的语音合成 AI 模型,目前可通过 Qwen API 访问。

IT 之家附 Qwen3-TTS 主要改进内容如下:

更加丰富的音色支持:Qwen3-TTS 提供超过 49 种音色,涵盖不同性别、年龄、地域特征与角色设定,包括撒娇搞怪 - 茉兔、青梅竹马 - 小野杏、傲娇率性的女汉子 - 十三、严厉老师 - 墨讲师、智慧老者 - 沧明子、萝莉萌妹 - 萌小姬等角色。

多语种多方言能力持续增强:Qwen3-TTS 支持中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等 10 大主流语言,在 MiniMax TTS multilingual test set 上,平均词错误率(WER)优于 MiniMax、ElevenLabs 及 GPT-4o-Audio-Preview;支持更多音色的方言生成,包括普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话,还原地方口音特色与语言神韵。

韵律 / 语速更加自然,更拟人化:相比于上一个版本,Qwen3-TTS 自适应根据文本调节语速和韵律的能力大幅提高,官方宣称拟人化程度逼近真人。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 语音合成 阿里 it之家
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论