钛媒体 App 12 月 15 日消息,阿里通义宣布开源 Fun-CosyVoice3-0.5B,该版本提供了 zero-shot 音色克隆能力,只需要提供一段 3 秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。此外,通义推出轻量化版本 Fun-ASR-Nano 模型,总参数量压缩到 0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。(广角观察)

钛媒体 App 12 月 15 日消息,阿里通义宣布开源 Fun-CosyVoice3-0.5B,该版本提供了 zero-shot 音色克隆能力,只需要提供一段 3 秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。此外,通义推出轻量化版本 Fun-ASR-Nano 模型,总参数量压缩到 0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦