VR陀螺 昨天
苹果悄悄推出的全新空间音频格式,能否成为沉浸式内容生态的关键拼图?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 /VR 陀螺 豌豆

苹果在 WWDC25 的一场开发者会议上悄然推出了一种新的空间音频(Spatial Audio)格式:Apple Spatial Audio Format(以下简称 ASAF),苹果表示这将带来 " 真正沉浸式的音频体验 "。

ASAF 是什么?它与杜比全景声 ( Dolby Atmos ) 或三星和谷歌的 Eclipsa Audio 等竞争对手的空间音频格式有何不同?更重要的是,它对像创作者、工程师和听众意味着什么——尤其是那些已经通过苹果现有空间音频产品(例如 AirPods Pro 2 等)享受到乐趣和沉浸感的人。

虽然立体声音频仍然可用,但现在更苹果建议创作者使用 Apple Positional Codec(以下简称 APAC)进行编码,为此有必要了解空间音频本身,以及 ASAF 如何融入苹果的战略。

  空间音频赛道的格式之争  

空间音频是一种在三维空间中传递声音的方式,并非将音频置于固定的左右立体声场中,而是允许声音在听众的上方、后方、下方或四周环绕。它能让用户在听音乐、看电影或玩游戏时,仿佛置身于一个由声音包围的环境中。

杜比全景声 Demo

虽然杜比全景声已成为家庭影院和流媒体内容空间音频的一大标准,但它并非唯一的选择。杜比全景声的工作原理是,对可在 3D 空间中动态定位的音频对象进行编码,然后根据听众的扬声器配置或耳机设置进行实时渲染,主要依赖于预定声音位置的概念。

相比之下,苹果推出新音频格式的这一举措既更像是对杜比全景声的拓展:杜比全景声可以通过苹果的新音频格式进行传输,该格式能够在此基础上添加一些额外的空间音频效果。苹果要求所有针对 Vision Pro 的新沉浸式视频内容必须采用 APAC 格式。创作者仍然能够使用杜比全景声,但他们需要将其封装在苹果定义的这一新格式中。

苹果推出了新的空间音频格式,不由得让人联想起今年 1 月的 CES 大会上,三星和谷歌发布的 Eclipsa Audio 格式。

2023 年,由三星、谷歌、Netflix、Meta 及其他顶尖企业组成的开放媒体联盟(AOM)正式采用空间音频模型和格式(IAMF),确立其为 3D 音频的产业标准。Eclipsa Audio 将在今年为某些 YouTube 视频上提供 3D 音频体验,同时三星 2025 系列电视与条形音箱也将支持该标准。

多年来,三星一直不支持动态 HDR 元数据的 Dolby Vision(杜比视界),而是选择推广其首选的替代方案 HDR10 Plus。至此,三星和谷歌对开源 3D 音频进行类似 HDR10+ 的竞争性或替代性推动,将使免费的 Eclipsa Audio 成为杜比全景声的竞争对手。

这对社交媒体来说,尤其是 YouTube 这样的视频平台,能够以一种较低成本的方式为用户提供沉浸音频体验,能为创作者的内容分发带来一定的支持。

苹果的头部追踪空间音频技术会监测到用户的头部运动,并相应地调整声场。如果用户将头向左转,音频就会 " 锚定 " 在屏幕上,让人感觉声音来自一个固定的方向。

  ASAF 的出现是否会引发另一场音频格式大战?

杜比的收入模式依赖于授权,Eclipsa Audio 以开源的方式走向视频流媒体,目前平台间的战火还未被点燃。但苹果的目的很可能是想早一步布局,推动苹果生态系统中的差异化,尤其是 Vision Pro。由此来看,ASAF 更像是有着专业性、高度优化且深度集成于苹果沉浸式视频内容体验的特点,且更希望能保持对自有平台上高端沉浸式体验的控制权。

苹果的新格式 ASAF 提供了更高的灵活性和真实感。但要理解其背后的原理,还需要了解 Apple 引入的技术栈。

  ASAF 格式,苹果的下一代空间音频革新  

ASAF 作为苹果全新的音频框架,旨在打造具有完全沉浸式、头部追踪和环境感知的音频体验。ASAF 格式在 WWDC25 的开发者会议视频 " 了解苹果沉浸式视频技术 " 上正式亮相,这也标志着苹果在空间音频创作领域的一次重要革新。

苹果此次更新的空间音频分为两部分:

据苹果沉浸式视频工程师 Blake Gordon 介绍:"ASAF 通过确保使用声学提示来渲染音频,实现了真正外化的音频体验。它由新的元数据、LPCM(一种无损音频编码方式)以及苹果平台内置的强大空间渲染器组成。它通过众多点源和高分辨率声音场景或高阶环绕声,产生高分辨率空间音频。渲染的音频完全基于对象的位置和方向,以及听众的位置和方向进行自适应。所有这些都不是预先设定的。ASAF 中的声音来自任何方向、任何位置和任何距离。ASAF 包含在带有线性 PCM 信号和元数据的广播 Wave 文件中。"

可以说,ASAF 的渲染引擎是基于对象且具有环境感知能力的。它能让声音感觉仿佛存在于用户周围的真实 3D 空间中。它不仅能实时适应用户的头部运动,还能根据物体的位置进行调整,在虚拟环境中动态调整音量、回声和混响等效果。

APAC,可作为编解码器可将对 ASAF 这一音频格式进行编码以便于传输。可在除 watchOS 之外的苹果平台上使用,包括 tvOS、iOS、iPadOS、macOS 和 visionOS,但在 visionOS 上会表现更佳。并支持通道、对象、高阶环绕声、对话、双耳音频、交互元素及可扩展元数据的配置。苹果以此进一步扩展空间计算生态中更丰富、更有层次感的音频效果。

而且,APAC 编解码器可在低至 64kbps 的比特率下工作,最高可达 768kbps。而常见的立体声音乐码率包括 128kbps、192kbps、256kbps 和 320kbps,其中 320kbps 的 MP3 文件可以提供接近无损的音质。虽然 APAC 这一数值看似较低,但与苹果、Netflix 等公司当前用于流媒体传输杜比全景声的最大比特率相同,因此可满足当前所需音频质量标准。

Vision Pro 采用开放式音频设计,双驱动单元音频单元可提供个性化音效,并根据音频光线追踪进行自适应调整

ASAF 和 APAC 共同构成了高分辨率自适应空间音频的管道,可深度融入苹果的生态系统,尤其是 visionOS 和 Vision Pro 头显。与杜比全景声略有不同的是,杜比全景声可以模拟用户静止地坐在虚拟影院中,而 ASAF 则可以根据以下情况动态调整音频:

用户的头部方向

VR 或 AR 空间内的实时定位

虚拟环境的变化(例如洞穴与开放空间中的混响和反射差异)

MR 应用中的环境或交互元素

这几点使得 ASAF 成为苹果空间计算内容的理想格式,包括 VR/AR 内容、沉浸式视频和类似 Vision Pro 上的交互式体验。ASAF 的优势在于其音频并非预先渲染混响、回声或距离等效果,而是基于元数据和头部位置进行实时渲染。这使苹果能够根据不同环境和场景动态调整体验。

例如在 Vision Pro 观看沉浸式视频的虚拟音乐会时,可能会有更好的体验:当你转头看向舞台左侧,ASAF 会实时调整歌手声音的方位,同时根据虚拟场馆的环境动态添加混响。

苹果押注空间音频赛道,不仅是将 ASAF 作为技术升级的一环,而是战略性地将空间音频内容与消费端连接的重要举措。

苹果有着软硬件的完整生态链,ASAF 旨在贯穿整个技术栈:它支持苹果多个系统平台;支持头部追踪的耳机和头显;通过 iPhone 16 或专业录音工具进行音频捕获;在专业工具如 Apple AAX 插件或 DaVinci Resolve Studio 进行内容创作,并能以 ".MP4" 格式交付。

此外,对于新版 visionOS 中新增的 Apple Projected Media Profile(APMP)视频格式,即对 QuickTime 或 MP4 视频类型的支持。Vision Pro 使用的是与 Meta Quest 和 YouTube VR 上支持的同样 Ambisonic 音频格式。录制完成后可以将音频编码为 APAC 并与 APMP 视频混合完成交付。

  写在最后  

空间音频技术的潜力不仅限于影视内容和游戏,苹果曾在 2023 年发布过一项关于将空间音频用于导航的专利,通过 AirPods、智能眼镜以及 Vision Pro 等产品,利用声音引导用户去往目的地。空间音频也有望被用于治疗、听力康复、教育培训、音乐会等场景。苹果正在构建从内容创作到消费者的完整沉浸式生态。

图 1 展示了使用 iPhone 和 AirPods 的空间音频导航;图 2A 展示了空间音频导航可以与未来的智能眼镜或 Vision Pro 一起使用(图源:Patenly Apple)

只是目前许多标注为 " 杜比全景声 " 的音轨听起来平淡或不自然,这可能是由于混音质量差或从立体声自动升频所致。空间音频背后的艺术性有待深入挖掘,且文件格式其强大程度取决于其背后的生态系统。ASAF 强大的功能也带来了更高的复杂性,博主 "Hugh Hou" 声称 ASAF 使用了数量惊人的声道,制作难度颇高,创作者至少需要一个 Voyage Audio Spatial Mic 才能开始使用。

可见 ASAF 不仅仅关乎音质,它更是一种从空间、交互和用户体验角度思考音频的全新方式。空间音频已不再是奢侈品,而是未来沉浸式内容的必需品。

  第一时间了解 XR 资讯  

  关注 VR 陀螺官网(vrtuoluo.cn)

VR 陀螺的联系方式:

商务合作 | 投稿 :

六六(微信号 13138755620)

寻求免费曝光:

六六(微信号 13138755620)

陀螺研究院热门报告

《2025 年 AI+AR 眼镜产业报告》

《2024 年度 XR 大空间产业报告》

《Micro-LED 微显示产业发展报告》

《Apple Vision Pro 核心技术拆解与供应链剖析报告》

《2024 全球 VR/AR 年度产业发展报告》

《2024 年全球 VR/AR 行业投融资报告》

《2024 年度全球 VR 游戏产业报告》

《2024 中国 XR 开发者调查报告》

《月报 | 2025 年 5 月全球 VR/AR 行业前沿动态》

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

三星 谷歌 vision youtube 杜比全景声
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论