生活消费网 21小时前
CANN开放端侧NPU自定义算子编程,助力QQ音乐首创移动端实时声伴分离
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

近日,华为开发者大会 2025 在松山湖成功举办。通过主题演讲、专题论坛等多元形式,结合沉浸式互动体验,为全球开发者搭建起思想碰撞与技术交流的平台。QQ 音乐作为鸿蒙应用开发领域的优秀典范,凭借其在技术创新与用户体验上的亮眼表现,在【HarmonyOS SDK】使能高效开发,打造优质创新应用体验分论坛中,为开发者进行了经验分享。

作为国内领先的流媒体音乐平台,QQ 音乐在数字音乐发展的浪潮中不断推陈出新,以满足用户日益多元化的音频体验诉求。论坛上,QQ 音乐音频算法研究员就通过 HarmonyOS SDK 实现端侧声伴分离的方案进行了介绍与解读。

QQ 音乐的 " 伴唱模式 " 可供用户自主调节人声与伴奏的占比,但在部分场景下,应用的声伴分离能力无法覆盖全量曲库。例如古风歌曲的听众往往热衷于 " 纯人声 " 听歌,但由于曲风小众等原因受限,很多歌曲不在其伴唱模式的支持范围内。基于此痛点,QQ 音乐与 HarmonyOS SDK 开展深化合作,利用 CANN 的端侧 NPU 自定义算子编程,为端侧音频处理带来了全新解决方案。

得益于此能力的开放,QQ 音乐基于 CANN 提供的工具链,通过算子原型定义、工程生成、代码编写等步骤,快速完成声伴分离核心算子开发。CANN 开放的端侧 NPU 自定义算子编程,就像开了一扇门,让从前只在云端跑的复杂算法,能 " 接地气 " 地在端侧高效运行。其编程语言 Ascend C,兼容 C/C++ 标准,支持自动并行调度与结构化核函数编程,大幅降低了算子的开发难度。例如,针对声伴分离中常用的序列建模等操作,利用 Ascend C 优化后,计算效率可显著提升。

在这个过程中,CANN 的作用至关重要。它不仅提供了高效的计算平台,还通过优化的内存管理和任务调度,确保了音乐分离过程的流畅性和实时性 。同时,NPU 自定义算子编程的灵活性,使得开发者能够根据不同的音乐分离算法和需求,定制最适合的计算逻辑,从而提高声伴分离的准确性和效率。

CANN 开放 Ascend C NPU 自定义算子编程能力,使能 QQ 音乐声伴分离功能落地 。不仅为 QQ 音乐用户带来了更加优质、全面的音频体验,也为开发者提供了全新的技术路径。未来,随着人工智能技术的不断进步,基于 HarmonyOS SDK 开放的技术特性将在更多领域得到应用,为用户带来更加智能、便捷的应用体验。

了解更多 HarmonyOS SDK 内容,请访问 HarmonyOS SDK 官网。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

qq音乐 编程 音乐 技术创新 qq
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论