近日,华为开发者大会 2025 在松山湖成功举办。通过主题演讲、专题论坛等多元形式,结合沉浸式互动体验,为全球开发者搭建起思想碰撞与技术交流的平台。QQ 音乐作为鸿蒙应用开发领域的优秀典范,凭借其在技术创新与用户体验上的亮眼表现,在【HarmonyOS SDK】使能高效开发,打造优质创新应用体验分论坛中,为开发者进行了经验分享。
作为国内领先的流媒体音乐平台,QQ 音乐在数字音乐发展的浪潮中不断推陈出新,以满足用户日益多元化的音频体验诉求。论坛上,QQ 音乐音频算法研究员就通过 HarmonyOS SDK 实现端侧声伴分离的方案进行了介绍与解读。
QQ 音乐的 " 伴唱模式 " 可供用户自主调节人声与伴奏的占比,但在部分场景下,应用的声伴分离能力无法覆盖全量曲库。例如古风歌曲的听众往往热衷于 " 纯人声 " 听歌,但由于曲风小众等原因受限,很多歌曲不在其伴唱模式的支持范围内。基于此痛点,QQ 音乐与 HarmonyOS SDK 开展深化合作,利用 CANN 的端侧 NPU 自定义算子编程,为端侧音频处理带来了全新解决方案。
得益于此能力的开放,QQ 音乐基于 CANN 提供的工具链,通过算子原型定义、工程生成、代码编写等步骤,快速完成声伴分离核心算子开发。CANN 开放的端侧 NPU 自定义算子编程,就像开了一扇门,让从前只在云端跑的复杂算法,能 " 接地气 " 地在端侧高效运行。其编程语言 Ascend C,兼容 C/C++ 标准,支持自动并行调度与结构化核函数编程,大幅降低了算子的开发难度。例如,针对声伴分离中常用的序列建模等操作,利用 Ascend C 优化后,计算效率可显著提升。
在这个过程中,CANN 的作用至关重要。它不仅提供了高效的计算平台,还通过优化的内存管理和任务调度,确保了音乐分离过程的流畅性和实时性 。同时,NPU 自定义算子编程的灵活性,使得开发者能够根据不同的音乐分离算法和需求,定制最适合的计算逻辑,从而提高声伴分离的准确性和效率。
CANN 开放 Ascend C NPU 自定义算子编程能力,使能 QQ 音乐声伴分离功能落地 。不仅为 QQ 音乐用户带来了更加优质、全面的音频体验,也为开发者提供了全新的技术路径。未来,随着人工智能技术的不断进步,基于 HarmonyOS SDK 开放的技术特性将在更多领域得到应用,为用户带来更加智能、便捷的应用体验。
了解更多 HarmonyOS SDK 内容,请访问 HarmonyOS SDK 官网。
登录后才可以发布评论哦
打开小程序可以发布评论哦