9 月 24 日,西湖心辰正式开源了 Westlake-Omni。
Westlake-Omni 是全球首个开源的中文情感语音交互端到端语音交互的模型,使用离散表示统一了文本和语音模态。模型设计注重实时性,能够快速响并提供体感零延迟的体验。
此外,Westlake-Omni 拥有强大的情感理解与表达能力,能够生成清晰、自然、富有表现力的中文语音。这些主要源自其在高质量中文情感语音数据集上的深度训练,让模型能够理解并表达中文语境下的复杂情感,使得交互更加人性化。
开源,是推动技术进步和创新的重要力量。西湖心辰希望通过 Westlake-Omni 的开源,让更多开发者加入到中文情感语音交互端到端语音技术的探索中来,共同推进中文情感语音交互技术的发展进程与应用边界。同时「心辰 Lingo」作为闭源端到端语音大模型,会在关键技术上持续深耕突破,为用户级合作伙伴提供更高质量且可规模化应用的端到端语音大模型服务。
登录后才可以发布评论哦
打开小程序可以发布评论哦