驱动之家 昨天
豆包音频生成模型1.0正式发布:一次性直出影视级的成品音效
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 6 月 23 日消息,在火山引擎 FORCE 原动力大会上,豆包大模型 2.1 Pro、豆包视频生成模型 Seedance 2.5、Seedance 2.0 4K 版、豆包图像创作模型 Seedream 5.0 Pro、豆包音频生成模型 1.0 五大模型集中亮相。

其中,豆包音频生成模型 1.0(Seed-Audio 1.0)正式发布,大幅降低高质量语音内容的规模化生产门槛。

豆包音频生成模型 1.0 支持在一次生成中同步编排角色对白、情绪语气、方言口音、背景音乐及拟音特效,一次性直出影视级的成品音效。

模型实现文生音频与参考音频的深度联动,在有声书、播客、长剧集等长音频创作中保持音色高度统一,大幅减少后期修音工作。

豆包音频生成模型 1.0 还支持 0 样本多模态参考,用户仅需输入一段描述,即可推理出与之匹配的声音特征。

整套音频模型补齐了豆包全链路创作的音频板块,搭配同场发布的图文、视频生成工具,文字、画面、音频创作全部实现 AI 一体化,给内容从业者提供了完整高效的一站式创作方案。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:随心

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 举报
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论