近日,国际声学、语音与信号处理会议(ICASSP 2026)公布录用结果。江苏省语言计算及应用重点实验室多篇论文成功入选,涵盖多语种语音识别、高效语音合成及低码率编解码等前沿方向。

作为由思必驰牵头,联合上海交通大学、苏州大学共建的战略科技力量,该实验室此次入选成果不仅展现了 " 产学研用 " 深度融合的创新实效,更标志着其在语音语言技术全链条创新上取得重要进展。在具体技术突破上,针对多语种识别中的数据不平衡难题,实验室提出的 MOSA 模型采用简单适配器混合结构,在参数量减少四成的情况下,实现了平均词错误率下降 13.3%,显著提升了车载等场景的跨语言交互能力。

针对语音合成的实时性痛点,DCAR 模型引入动态分块预测策略,将推理速度提升至 2.61 倍,可懂度最高提升 72.27%,为实时人机交互扫清了障碍。此外,CodecSlime 低码率编解码技术通过动态帧率机制,在约 600bps 码率下实现了重建错误率大幅降低,有效解决了弱网环境下的传输稳定性问题。
据悉,相关成果已直接支撑思必驰在智能车载、智慧办公及智能家居等领域的核心能力升级,不仅优化了端云协同效率,更在多语种交互一致性与复杂场景感知力上实现了质的飞跃。


登录后才可以发布评论哦
打开小程序可以发布评论哦