36 氪获悉,据小米技术消息,近日,小米集团 AI 实验室新一代 Kaldi 团队发布了基于 Flow Matching 架构的 ZipVoice 系列语音合成(TTS)模型—— ZipVoice(零样本单说话人语音合成模型)与 ZipVoice-Dialog(零样本对话语音合成模型)。ZipVoice 解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点,ZipVoice-Dialog 则解决了现有对话语音合成模型在稳定性和推理速度上的瓶颈。
36 氪获悉,据小米技术消息,近日,小米集团 AI 实验室新一代 Kaldi 团队发布了基于 Flow Matching 架构的 ZipVoice 系列语音合成(TTS)模型—— ZipVoice(零样本单说话人语音合成模型)与 ZipVoice-Dialog(零样本对话语音合成模型)。ZipVoice 解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点,ZipVoice-Dialog 则解决了现有对话语音合成模型在稳定性和推理速度上的瓶颈。
登录后才可以发布评论哦
打开小程序可以发布评论哦