阿里通义推出语音识别大模型Fun-ASR1.5：覆盖30种语言支持汉语七大方言体系

快科技 4 月 20 日消息，据媒体报道，阿里通义实验室近日正式推出语音识别大模型 Fun-ASR1.5。

该模型基于统一的大模型架构，单模型即可无缝覆盖 30 种语言、汉语七大方言体系及 20 余种地方口音，甚至连古诗词吟诵也能精准转写。

测试显示，在典型方言场景下，字错误率（CER）相对下降 56.2%。目前已有 5 种方言的识别准确率突破 90%，15 种超过 80%。

Fun-ASR1.5 还具备智能语音内容整理能力：可自动为长句添加标点符号，并将口语化的数字、日期、金额、手机号等统一转换为标准书面格式。

在会议纪要、采访录音、司法笔录整理等场景中，能大幅减少人工校对工作量。

用户既可通过阿里云百炼平台调用该模型的 API，也可前往魔搭社区免费在线体验 Fun-ASR1.5 的全部能力。

阿里云百炼：https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr

魔搭社区：https://modelscope.cn/studios/iic/FunAudio-ASR

宙世代