全球 AI 持续高速迭代。
OpenAI 于 2025 年 12 月 11 日发布 GPT 最新版本 GPT-5.2。在 2025 年 8 月 8 日推出 GPT-5 后 3 个月,OpenAI 既已于 2025 年 11 月 13 日发布了 GPT-5.1,如今时隔 1 个月再次更新。这被认为是 OpenAI 针对谷歌 2025 年 11 月 18 日发布 Gemini 3 所带来挑战的应对之举。
全球头部 AI 玩家基于技术优势,正在席卷写作、绘画、音乐等诸多创意领域,而音乐领域涉及大众的情感表达与娱乐消费,又事关复杂的版权生态,尤为引人注目。
谷歌旗下人工智能公司 DeepMind,2024 年 5 月与同属谷歌阵营的 YouTube 合作,推出了 AI 音乐创作工具 Music AI Sandbox,用户可借此生成和优化音乐作品,且完成后可以一键上传至 YouTube 平台。2025 年 4 月,谷歌又推出新一代音乐制作模型 Lyria 2,并将其集成到 Music AI Sandbox 中。Lyria 2 可以生成多种风格的音乐,支持以文本提示生成完整的歌曲,包括旋律、编曲和人声。
据 The Information 于 2025 年 10 月发布的报道,OpenAI 已在开发 AI 音乐生成工具,还与美国知名艺术院校茱莉亚学院的学生合作,标注乐谱以构建高质量模型训练数据。
技术跃迁使 AI 音乐开始跻身国内外多类音乐榜单。
以音乐流媒体平台 Spotify 为例,Spotify Viral 50,即全球飙升榜前 50 名,在 2025 年 11 月内多次出现 AI 音乐,其中热门的《Walk My Walk》播放量超过 640 万。由美国诗人泰莉莎(Telisha Nikki Jones)利用 AI 音乐生成平台 Suno 创造的虚拟歌手 Xania Monet,在 Spotify 上拥有超过 120 万听众,其热门曲目《How Was I Supposed to Know?》登上了美国知名音乐榜单 Billboard。

国内自 2025 年 2 月从使用 DeepSeek 创作的《七天爱人》,到 2025 年 10 月、11 月登上 B 站热门的《美猴亡》《Money Back My Home》,再到抖音 AI 热曲《远山少年》《不能不想你》等,播放量都在百万以上,最高者超过 1000 万。
作品的火热使市场对 AI 音乐生成平台投以高光。
在 AI 音乐的垂直领域更为知名的海外玩家是 Suno 和 Udio。两家公司均致力于让 AI 能够根据文字描述,直接生成包含人声、歌词和编曲的完整歌曲。
Suno 创立于 2022 年,目前已推出 V5 版本,2025 年 11 月获得了由 Menlo Ventures 领投的 2.5 亿美元(约合人民币 17.6 亿元)投资,公司估值达 24.5 亿美元(约合人民币 172.8 亿元)。

Udio 由谷歌前研究人员创立,2024 年 4 月上线后引发市场关注,且很快拿到超过 1000 万美元投资(约合人民币 7000 万元)。

国内亦有多家公司积极投身其中,比如推出海绵音乐的字节跳动、推出天音 AI 的网易云音乐、推出 Inspire Music 的阿里和推出天工 SkyMusic 的昆仑万维等。
大幅降低创作的技术门槛后,AI 音乐使音乐创作变得更广泛和普及,为行业注入了前所未有的活力。但争议亦如影随形——部分听众对 AI 作品有天然反感,版权问题在法律和伦理层面都待解决。狂飙突进的同时,AI 音乐仍需穿越迷雾。
新意起于技术
国内质量颇高的 AI 音乐作品已进入大众视野。
在 B 站爆火的《美猴亡》即是一例。博主 " 漫游会议室 " 于 2025 年 10 月发布视频,名为 " 大圣深夜崩溃,悲情演唱《美猴亡》",目前该视频在 B 站播放量已超过 1344 万,并被收录至 B 站 " 每周必看 " 榜单。视频内容为经典电视剧《西游记》孙悟空形象戴着耳机,在录音棚内演唱歌曲《美猴亡》,词、曲、演唱均署名孙悟空。
不少用户喜爱《美猴亡》情感浓烈的摇滚风格和独树一帜的歌词。在 B 站的弹幕、评论中,许多人都提及作品词曲质量极高,比如 " 他们杀死了美猴王,用虚名,用香火,用金光 "" 他们供着我的金身像,却烧了我睡过的草窝 " 等歌词金句。《美猴亡》的走红还带来了许多音乐博主的翻唱,比如歌手曾一鸣,目前翻唱视频播放量已超过 114 万。
在 B 站主页," 漫游会议室 " 表示,除了 B 站之外,自己仅将这些歌曲授权上传到了网易云音乐。《美猴亡》也数次位列网易云音乐摇滚榜单前三。由于《美猴亡》词曲质量和情感表达出色,有的用户甚至质疑它并非 AI 作品。而该博主明确将这些歌曲视频都收录在自己创建的 "《西游记》AI 歌曲 " 合辑中。
惊人高产也是 AI 作品的旁证之一。据海克财经观察,自 2025 年 10 月 20 日至 11 月 2 日," 漫游会议室 " 每天发布一首歌曲作品,均以《西游记》角色的自传口吻书写歌词,包括黑熊精、高翠兰、哮天犬、玉兔精等;截至目前,博主的 AI 歌曲合辑已发布了 26 首作品,B 站累计播放量超过 6315 万;因为作词、作曲和演唱都是 AI 创作,这些歌曲被网友戏称为 "3A 大作 "。

热门 AI 歌曲还有 B 站博主 " 猫爷说道 AIGC" 于 2025 年 11 月发布的《Money Back My Home》,目前播放量超过 481 万。该博主明确表示,这首作品只有歌词是自己写作的,其他均为 AI 创作。
优质 AI 音乐的涌现得益于技术演进。
回望 2022 年 11 月,ChatGPT 横空出世,彼时便有开发者关注到 AI 音乐领域。ChatGPT 的诞生标志着自然语言处理技术(NLP)迈入新阶段,展现了 AI 的通用能力、与人类协作能力的飞跃,这种能力被认为可以迁移到各个领域。
需要说明的是,ChatGPT 建立在神经网络结构 Transformer 框架的基础上,Suno 也是如此,只是二者分别专注于文字和音乐的处理。音乐的本质是有组织、有规律的声波,这些声波可以被标记为连续的电信号,与模型最小意义单元 token 对应起来。音乐不同维度的元素,包括节奏、和声、旋律、歌词乃至唱腔音色,都可以被转化为 token 序列。这种将信息转化为 token 的过程,被称为 tokenization,即 token 化。
但将歌曲转化为 token,面临着数据量的难题。数字音频以 CD 标准的采样率 44.1kHz 计算,每秒要对模拟音频信号进行 44100 次采样,一首 3 分钟的歌曲就有近 800 万次采样。如果每次采样对应一个 token,产生的 token 数量对模型训练而言显然过于庞大。Meta、谷歌等头部 AI 玩家推出了高效的神经音频编解码工具,能够将原始采样压缩数十至数百倍再 token 化,才使 AI 音乐的广泛应用成为可能。
在 2025 年 1 月,Suno 创始人、CEO 迈克 · 舒尔曼(Mikey Shulman)在接受海外知名播客 20VC 访谈时还提及,他们的创新不在于模型架构,而在于音频标识方法——他们投入了大量时间解决音频 token 化难题,还借鉴了开源社区在模型构建和扩展方面的所有经验。
创作能力飞跃
AI 音乐的能力可以用日新月异来形容。
2023 年时,多模态技术还未突破瓶颈,即便压缩音频采样数量,也难以将节拍、速度、和声、情感、乐器、歌词等音乐丰富的元素统一编码。因此,AI 在音乐方面的生成能力主要集中在相对单一的维度,比如对人声的模拟。
"AI 孙燕姿 " 的走红即是如此。2023 年 4 月,有网友上传 AI 模仿孙燕姿声线的演唱视频,翻唱了《红豆》《发如雪》《爱在西元前》等歌曲,有的视频播放量超过 300 万。引发热议后,孙燕姿本人发文表示难以与 AI 匹敌,AI 正把人变得 " 可预测 "" 可定制 ",她只能选择 " 做自己 "。
歌曲《Heart on My Sleeve》情况相似。歌曲模仿了知名歌手 Drake 和 The Weeknd 的声音与风格,2023 年 4 月发布后迅速在 TikTok、Spotify 等平台走红,但很快被 Drake 和 The Weeknd 所属的音乐公司环球音乐指控侵权并勒令下架。
之后,多模态技术的跃迁就让一键生成音乐变得简单。到了 2024 年 3 月,有人将连花清瘟胶囊的说明书输入 Suno,AI 就生成了一首以说明书文字内容为歌词,结构完整的歌曲。尽管该作品旋律结构相对简单,中文咬字略显生硬,但已足够说明 AI 的能力。
技术提升使 AI 能处理的数据量更大、更精准,容纳的多模态元素也更多。
2024 年 3 月上线的 Suno V3 版本和同年 4 月上线的 Udio,已经拥有了一键生成音乐的能力,但作品还有较为明显的 "AI 味儿 ",旋律、咬字、情感等方面都还有较大提升空间。到了 2025 年,Suno V5 和新版 Udio 产生的作品整体性已非常强,听感与人类创作相差无几,不少作品在音乐行业内处于中上水平。
专业音乐人的评价颇能说明问题。
比如 B 站音乐博主 " 呆若木一在此 " 发布了 "AI 能打败音乐人吗 " 视频,请来新生代歌手吕彦良、秦凡淇试听 AI 改编他们的原创曲目,还请来歌手刘恋等音乐人参与对不同版本编曲的盲选,其中几位评委直接将票投给了 AI 编曲。视频中,曾获台湾金曲奖最佳新人奖提名的吕彦良感慨,AI 音乐创作能力超过了 99% 的人,甚至大部分音乐从业者的水平都不如 AI。

国内头部游戏音乐制作公司小旭音乐的 CEO 卢小旭有相似看法,他曾多次在公开场合推崇 AI 音乐,认为 AI 音乐必将重构行业。成立于 2006 年的小旭音乐曾为《QQ 斗地主》《天龙八部》《诛仙》等超过 1000 款游戏制作音乐,2024 年时专门成立了 AI 音视频团队 " 小旭 AI Studio"。
更重要的是,AI 音乐技术的创新进程仍在加速。
原先 AI 一键生成音乐的模式使创作处于不可控的黑箱中,用户难以做出针对性的局部调整。Udio 率先于 2025 年 6 月推出可视化编辑工具 Sessions,能够智能识别歌曲结构,允许用户对具体段落进行移动、扩展或替换,且能自动将修改后的部分融入整体作品,保证创作的一致性。Suno 则于 2025 年 9 月推出 V5 后,又推出数字音频工作站 Suno Studio,用户在其中可以精细调整多个音轨,对任意段落进行编辑或按照指令重新生成。
这意味着 AI 音乐的制作流程专业度和可控性进一步提升,也使作品质量再度提升,"AI 味儿 " 越来越淡,甚至趋近于无。法国音乐流媒体平台 Deezer 与调研机构益普索 2025 年 11 月发布的联合调查报告显示,在法国、英国、加拿大等 8 个国家的超过 9000 名受访者中,97% 的受访者无法区分 AI 生成音乐与人类创作作品。

据海克财经了解,AI 音乐现在已经能模拟出现场感,直接生成 Live 版本的歌曲。
所谓 Live 版本,即歌手或乐队现场演出的录音版本,大多包含观众的欢呼、掌声等,还有乐手、演唱者的现场发挥和不同物理空间内的混响。在 Suno 或 Udio 输入 Acoustic(原声)、Live Concert Recording(现场录音)等提示词,就能生成带有现场听觉质感的音乐作品。
透明度待提升
技术革新影响 AI 音乐的商业模式。
从创作者角度来说,AI 音乐已从早期的以量取胜转向如今的精品化。质地较粗糙时,有使用 AI 生成工具的用户依靠刷量从音乐平台赚取收益。比如 2024 年 9 月被起诉的美国男子迈克尔 · 史密斯(Michael Smith),他使用 AI 工具,规模化生成了数十万首歌曲,然后将这些歌曲上传至 Amazon Music、Spotify 等多个海外音乐平台,又部署多个云端服务账号和账户伪造流媒体播放量来获取版税分成收益。据《纽约 · 时报》等媒体报道,该案件总涉案金额超过 1000 万美元(约合人民币 7000 万元)。
当下则有越来越多创作者使用 AI 生成高质量作品。前述 B 站《美猴亡》《Money Back My Home》等均是如此;类似的还有很多,如抖音热门 AI 歌曲《不能不想你》,后者由博主 " 浮生未歇 " 创作,该博主在视频中表示,出售这首歌曲版权的收益为 80 万元。
需要说明的是,Spotify 允许 AI 音乐获取版权分成收益,而国内各音乐平台对待 AI 音乐的策略各有不同。腾讯音乐旗下酷狗音乐、QQ 音乐等平台,AI 音乐制作者无法签约,也没有收益;网易云音乐可以签约,但 AI 作品无分成收益;字节旗下汽水音乐则允许 AI 音乐获得收益。
即便听感没有明显差异,也有不少用户介意所听歌曲为 AI 生成。于是,在目前甄别技术尚不完善的情况下,许多创作者会设法规避平台审核,不主动标注作品为 AI 生成。B 站博主 "SevenTeamMusic" 就在视频中做过实验,手动简单微调歌曲,就能使 AI 歌曲被平台判定为人工作品。
若 AI 仅部分介入创作,作品经过分段调整并由创作者进行重录和精修,那么平台进行技术甄别则更为困难。比如国内乐队 " 灵活就业 " 主创王博龙在播客中提及,乐队比较热门的作品《创作者中心》《菠菜去打工》等均有 Suno 等 AI 工具参与创作,有时他只是哼一小段旋律,就能让 AI 根据旋律把整首歌曲的编曲做完。据海克财经观察,该乐队在网易云音乐上传了超过 30 首歌曲,均未标注为 AI 音乐。

汽水音乐则有明确的 AI 音乐激励计划,会为 AI 作品提供播放收益。AI 作品往往符合 " 神曲 " 的创作逻辑,自带 " 洗脑 " 听感,短视频又天然适合此类作品传播,与抖音打通的汽水音乐便更有利于 AI 音乐发展。B 站、小红书等平台已有不少教程,教授用户如何利用 AI 工具生成音乐并上传至汽水音乐来获取收益。
创作者对汽水音乐的重视,与该平台用户迅猛增长有关。调研机构 Quest Mobile 数据显示,2025 年 9 月,汽水音乐在国内在线音乐 APP 用户规模排行中位列第四,MAU(月活跃用户数)为 1.2 亿,同比增长 90.7%,前三名则是酷狗音乐(2.1 亿)、QQ 音乐(1.9 亿)和网易云音乐(1.5 亿)。

但 AI 音乐在版权方面仍存在诸多问题。
2024 年 6 月,全球三大唱片公司环球音乐、华纳音乐和索尼音乐均向 Suno 和 Udio 发起诉讼,认为 AI 平台使用了未授权音乐进行训练。到了 2025 年 10 月和 11 月,Udio 分别与环球音乐、华纳音乐和解,计划推出完全获得授权的订阅制 AI 平台,允许用户在遵守规则的前提下使用授权的声音和作品进行创作,并建立版税分成模式。Suno 也于 2025 年 11 月与华纳音乐和解,预备合作推出具有完整授权的新模型。而索尼音乐的诉讼则仍在进行中。
版权争议不仅存在于模型训练与内容生产环节,更直接指向最终作品的版权归属。当用户通过 AI 工具将自己的哼唱或歌词片段扩展成完整歌曲,音乐作品便成为人类创意、算法执行与海量训练数据融合的复合产物,很难明确版权应当归属被学习的原始音乐还是平台,抑或是用户本人。
针对 AI 音乐的标注问题,谷歌采取的方案是将 SynthID 水印技术嵌入 Lyria2 及其他旗下 AI 工具生成的 AI 音频中。SynthID 是一种普通用户无法感知的数字水印,旨在保证不影响听感的情况下,让 AI 生成内容可被识别。
AI 音乐已超越简单的工具革新,或将系统性重构音乐产业的商业逻辑,包括从上游的创作与授权、中游的分发与推广,到下游的消费与互动。待解决的关键问题还有很多,比如训练数据的版权归属、人机协作的创作伦理以及人类听众的情感接纳与价值认同,但 AI 音乐已是音乐产业不得不面对且并不遥远的未来。


登录后才可以发布评论哦
打开小程序可以发布评论哦