在世界海豚日(4 月 14 日),谷歌宣布,他们开发了一个帮助解码海豚交流的人工智能模型:DolphinGemma。
这是第一个尝试理解海豚语言的大语言模型。他们不仅想知道海豚到底在说什么,还试图创造出豚言豚语来和海豚交流。
AI 真的能让我们跟海豚说上话吗?
谷歌对海豚做了什么
DolphinGemma 是谷歌与 " 野生海豚计划 "(Wild Dolphin Project,WDP)合作开发的。
WDP 是一个非盈利的研究机构,他们从 1985 年开始,一直在追踪巴哈马的大西洋斑海豚,收集了长达数十年的单个海豚的水下视频和音频,以及海豚的生活史和行为。
一只海豚一边觅食一边看着幼崽,她会用独特的哨音叫孩子回来,右图为这种哨音的可视化频谱图|DolphinGemma
WDP 的音频数据库里,有一半是海洋噪音,剩下的则是海豚经常发出的三类声音。WDP 根据几十年的观察,将一些声音与特定的行为情境匹配了起来:
· 识别哨音(signature whistles)
海豚个体发出的独特且可以辨认的口哨音,有点像海豚的名字。海豚母亲和孩子之间常常用这种哨音来互相找回对方。
· 爆裂脉冲(burst pulses)
这种声音常常是海豚在打架时发出的尖锐短促的声音,听起来有点像刺耳的尖叫。
· 咔嗒声(clicks)
海豚通常会用咔哒声来定位和探测。快速连续的咔嗒声,连在一起听起来像 " 嗡嗡 " 声(buzzes),往往出现在海豚求偶时表达兴趣或者驱赶鲨鱼等猎食者。
DolphinGemma 是一个音频输入、音频输出的模型。它先利用 WDP 的音频数据库进行训练,通过分析自然环境下海豚声音序列的模式和结构,最终预测出序列的下一个声音——就像打字的时候,输入法会联想你下一步想打什么字一样。
DolphinGemma 在早期测试阶段产生的哨音(左)和爆裂脉冲(右)的可视化频谱。DolphinGemma 将海豚的自然声音编码为声学单元进行处理,并输出生成新的模拟海豚声音的音频序列|DolphinGemma
此外,谷歌和 WDP 还试图创造一些新的语言来跟海豚交流。他们与佐治亚理工学院(Georgia Institute of Technology)合作,开发了一个名为 " 鲸类动物听力增强遥感 "(Cetacean Hearing Augmentation Telemetry,CHAT)的系统。
摁一下面板上的按钮会发出特定的声音,用 " 海豚语 " 教海豚说海草这个词|DolphinGemma
这是一台水下计算机,研究者利用它发出一些类似海豚的声音,并将这些词汇与特地的物品联系起来(比如海藻、海草、研究者的围巾)。
他们背着这个计算机来到水下,当研究者 A 使用 CHAT 发出某个声音时,研究者 B 会将对应的物品递给 A ——他们希望,围观这一来回互动的海豚可以明白这种模式,并且模仿出这个声音。DolphinGemma 则可以帮助预测和识别海豚的模仿,以便于研究者迅速地对海豚的模仿给予反馈,从而实现与海豚的交流。
比如,研究者 A 使用 CHAT 发出代表围巾的音,研究者 B 会将围巾递给 A。研究者设想海豚在偷偷观察后会学会 " 围巾 " 怎么说|DolphinGemma
WDP 今年将在野外应用 DolphinGemma。这个模型仅有约 400M,直接在谷歌推出的 Pixel 手机上就能运行,这能适应水下环境便于实地应用。研究团队希望,DolphinGemma 可以通过识别反复出现的声音模式和序列,帮助研究人员发现海豚自然交流中的隐藏结构和潜在的含义。
真的可以交流吗?
但这不意味着我们已经破译海豚的语言了。相反地,正如 WDP 的研究总监 Denise Herzing 所说:我们并不确定海豚是否有语言。
海豚常发出三种不同类型的声音,虽然这些声音与特定行为高度相关,但科学家尚不确定它们是否拥有明确、具体的含义——比如是否代表 " 某个物体 " 或 " 某个动作 "。更重要的是,即使这些声音可以被视为 " 词汇 ",我们仍然不清楚海豚是否具备类似的语法结构来组织这些词汇,从而表达更为复杂的含义。
因此,DolphinGemma 对 " 海豚语言 " 的破译,更多的只是对声音序列的分析。研究团队希望,通过 AI 对这些豚言豚语的学习,发现海豚交流方式中一些细微的人类无法识别的模式——得益于这几年大语言模型的发展,这比人类手动学习要快得多。
如果 DolphinGemma 发现了某种固定的声音模式,WDP 多年的观察结果则可以提供 " 发出这个声音时,海豚在做什么 " 的信息,这就有可能了解海豚的交流方式,甚至了解它们的语言和文化。不过从目前来看,我们最多只是理解了声音与行为之间的联系,还不算真正翻译出 " 海豚语言 "。
一群大西洋斑海豚(Stenella frontalis)|Google
另外,不管是 DolphinGemma 对声音序列的解析,还是 CHAT 项目试图与海豚互动,这些研究都是基于 WDP 在巴哈马追踪的大西洋斑海豚。但不同地区、不同种群的海豚,发声方式可能存在差异,可能也有自己的方言和口音。因此,DolphinGemma 目前的训练成果不一定能推广到其他海豚上。
谷歌表示,他们预计将在今年夏天开源 DolphinGemma。届时,DolphinGemma 还能用于其他鲸豚物种的声学研究。
AI 加持下的动物研究
DolphinGemma 并不是第一个想要破译动物语言的模型。在人工智能迅猛发展的这几年,越来越多的动物研究里都有了 AI 的身影。
一个名为 "鲸类翻译倡议"(Cetacean Translation Initiative,CETI)的非盈利研究项目,专注于解码抹香鲸的交流。抹香鲸最常发出的声音是一连串的咔哒声,这种像摩斯密码一样的声音被称为 " 密码曲 "。CETI 收集了 60 头抹香鲸的 8000 多条密码曲,通过传统的统计分析和机器学习,发现咔哒声的数量、节奏和节奏的变化组成了不同的密码曲。他们认为,抹香鲸可以通过无限的组合创造出各种密码曲,从而拥有庞大的交流系统;但目前仍无法破解这些咔哒声和密码曲包含了什么信息。
CETI 项目尝试 " 解码 " 抹香鲸的交流系统。图中展示了从水下机器人和无人机收集语音与行为数据开始,经过数据处理、共享与可视化,结合鲸类社会行为、生物学观察、机器学习和语言学分析,逐步构建鲸类语言模型,尝试理解其语法、语义及交流内容|CETI
另一个研究团体 "地球物种项目"(Earth Species Project)关注的物种更多,包括乌鸦、白鲸、大象等。他们同样希望利用人工智能,解码动物的交流。他们认为这有助于动物保护,比如帮助濒危物种保留它们的语言,或者通过破译鲸豚类动物的语言,在它们即将浮出水面时,提醒附近船只避开动物。
此外,还有用于分析啮齿类动物、非人灵长类动物叫声语义的模型。2022 年发表在《自然 - 通讯》的一篇研究,通过机器学习,发现了斑胸草雀不同圈养种群之间求偶歌曲的差异,而且这种差异会影响雌性的选择。研究者认为,人工智能可以找出人类尚未发现细微的差别。
斑胸草雀(Taeniopygia guttata)|christoph_moning / Wikimedia Commons
破译语言难度还很大,而通过人工智能分析声音、识别物种的技术则成熟得多,这些技术也常常用在动物保护工作中。
由康奈尔鸟类实验室开发的BirdNet,通过机器学习来检测和分类鸟的鸣叫声,目前可以识别约 3000 种常见鸟类物种。BirdNet 可以直接在手机上使用,为观鸟爱好者、公民科学家和保护工作者提供识别的工具。
今年年初,AI 还帮人们发现了一种在当地消失近 30 年的鸟。在澳大利亚墨尔本西部的草原上,保护组织安装了 35 个录音机,收集了数万个小时的录音。他们使用 AI 对录音进行筛选,AI 从其中两个地点发现了一种轻柔低沉的 "Ooming" 声——这是领鹑的叫声,人类专家随后确认了 AI 的发现。
领鹑是澳大利亚特有种,因为栖息地的丧失,其种群数量大幅下降,现在属于极度濒危物种,上次在这片地区出现还是 1989 年。如果没有 AI,人类要从海量的声音信息里发现领鹑,工作量将会大得多。
AI 帮助研究者找到了领鹑(Pedionomus torquatus)的踪迹|JJ Harrison / Wikimedia Commons
我们好像总是想知道动物在说什么,家中的宠物在表达什么需求,大自然里的动物在交换什么情报……这可能只是出于本能的好奇,但如果能够了解动物之间的交流,我们就可以更懂动物,懂得它们的需求,或许也更懂得它们之间的情感和连结,懂得它们与人类的相似与平等。
但对我们人类来说,动物之间的交流还有太多的未知,自然还有太多的神秘。人工智能可以解开这些秘密吗?拭目以待吧。
参考文献
[ 1 ] https://blog.google/technology/ai/dolphingemma/
[ 2 ] https://apnews.com/article/sperm-whale-language-talk-clicks-a94df8e07b129f19917437fcb85e7655
[ 3 ] https://apnews.com/article/artificial-intelligence-climate-change-reid-hoffman-ab1d38583c4102185a494e465358963e
[ 4 ] https://www.nature.com/articles/s41467-022-28881-w
[ 5 ] https://www.theguardian.com/environment/2025/feb/12/plains-wanderers-spotted-in-melbournes-west-for-first-time-in-30-years-with-help-of-ai
作者:麦麦
编辑:黄线狭鳕
题图来源:Veronica Maglieri, Federica Vantaggio, Elisabetta Palagi, Livio Favaro
本文来自果壳自然(ID:GuokrNature)
如需转载请联系 sns@guokr.com
欢迎转发到朋友圈
登录后才可以发布评论哦
打开小程序可以发布评论哦