钛媒体快报 21小时前
阿里通义百聆推出语音模型新版本
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

钛媒体 App 12 月 15 日消息,阿里通义宣布开源 Fun-CosyVoice3-0.5B,该版本提供了 zero-shot 音色克隆能力,只需要提供一段 3 秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。此外,通义推出轻量化版本 Fun-ASR-Nano 模型,总参数量压缩到 0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。(广角观察)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 钛媒体 开源 广角 轻量化
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论