科创板日报 01-21
字节发布豆包实时语音模型 国内AI应用有望迎井喷式发展
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包 App 实时语音通话功能。目前,豆包 APP 已小范围测试最新能力,部分用户在豆包 App 的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过 GPT-4o。据了解,该传言提及模型即为上述实时语音模型。最新模型通过面向语音生成和理解进行统一建模,区别于此前的 ASR+LLM+TTS 级联方式,在对话效果上有大幅提升,实时交互上不仅低延时,也能流畅打断。

根据火山引擎 2024 冬季 force 原动力大会披露的数据,豆包大模型的日均调用量在高速增长,2024 年 5 月豆包大模型的日均 tokens 调用量为 1200 亿,7 月增长到 5000 亿,9 月达 1.3 万亿,截止 2024 年 12 月 15 日已经突破了 4 万亿,在 7 个月的时间里增长超过 33 倍。中信证券表示,豆包大模型表现超预期,体现字节跳动在 AI 的投入形成正反馈,国内 AI 产业追赶海外的效果开始体现,国内龙头公司有望加速在 AI 领域的投入。

据财联社主题库显示,相关上市公司中:

海天瑞声在互动平台回复称,字节跳动一直以来是公司的重要客户,公司为其提供智能语音、计算机视觉以及自然语言等各类数据产品或服务。

乐鑫科技在投资者关系活动上表示,公司联合推广豆包大模型落地在 IoT 设备的相关应用方案。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 效果 字节跳动 上市公司 智能语音
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论