钛媒体快报 04-24
阶跃星辰发布自动语音识别模型StepAudio 2.5 ASR
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

钛媒体 App 4 月 24 日消息,阶跃星辰正式发布新一代自动语音识别模型 StepAudio 2.5 ASR。据介绍,该模型的核心突破在于兼得速度与精度,基于 ASR+MTP-5 深度融合架构,实测推理速度提升 400%、时延降低 60%,推理峰值达 500 tokens/s,推理成本直降 80%。同时,模型通过复用 LLM 原生的 32K 上下文窗口,单次可完整转写长达 30 分钟的音频。(广角观察)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

语音识别 广角
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论