物种日历 04-16
谷歌竟然想用“海豚语”教会海豚什么是围巾?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在世界海豚日(4 月 14 日),谷歌宣布,他们开发了一个帮助解码海豚交流的人工智能模型:DolphinGemma

这是第一个尝试理解海豚语言的大语言模型。他们不仅想知道海豚到底在说什么,还试图创造出豚言豚语来和海豚交流。

AI 真的能让我们跟海豚说上话吗?

谷歌对海豚做了什么

DolphinGemma 是谷歌与 " 野生海豚计划 "(Wild Dolphin Project,WDP)合作开发的。

WDP 是一个非盈利的研究机构,他们从 1985 年开始,一直在追踪巴哈马的大西洋斑海豚,收集了长达数十年的单个海豚的水下视频和音频,以及海豚的生活史和行为。

一只海豚一边觅食一边看着幼崽,她会用独特的哨音叫孩子回来,右图为这种哨音的可视化频谱图|DolphinGemma

WDP 的音频数据库里,有一半是海洋噪音,剩下的则是海豚经常发出的三类声音。WDP 根据几十年的观察,将一些声音与特定的行为情境匹配了起来:

· 识别哨音(signature whistles)

海豚个体发出的独特且可以辨认的口哨音,有点像海豚的名字。海豚母亲和孩子之间常常用这种哨音来互相找回对方。

· 爆裂脉冲(burst pulses)

这种声音常常是海豚在打架时发出的尖锐短促的声音,听起来有点像刺耳的尖叫。

· 咔嗒声(clicks)

海豚通常会用咔哒声来定位和探测。快速连续的咔嗒声,连在一起听起来像 " 嗡嗡 " 声(buzzes),往往出现在海豚求偶时表达兴趣或者驱赶鲨鱼等猎食者。

DolphinGemma 是一个音频输入、音频输出的模型。它先利用 WDP 的音频数据库进行训练,通过分析自然环境下海豚声音序列的模式和结构,最终预测出序列的下一个声音——就像打字的时候,输入法会联想你下一步想打什么字一样。

DolphinGemma 在早期测试阶段产生的哨音(左)和爆裂脉冲(右)的可视化频谱。DolphinGemma 将海豚的自然声音编码为声学单元进行处理,并输出生成新的模拟海豚声音的音频序列|DolphinGemma

此外,谷歌和 WDP 还试图创造一些新的语言来跟海豚交流。他们与佐治亚理工学院(Georgia Institute of Technology)合作,开发了一个名为 " 鲸类动物听力增强遥感 "(Cetacean Hearing Augmentation Telemetry,CHAT)的系统。

摁一下面板上的按钮会发出特定的声音,用 " 海豚语 " 教海豚说海草这个词|DolphinGemma

这是一台水下计算机,研究者利用它发出一些类似海豚的声音,并将这些词汇与特地的物品联系起来(比如海藻、海草、研究者的围巾)。

他们背着这个计算机来到水下,当研究者 A 使用 CHAT 发出某个声音时,研究者 B 会将对应的物品递给 A ——他们希望,围观这一来回互动的海豚可以明白这种模式,并且模仿出这个声音。DolphinGemma 则可以帮助预测和识别海豚的模仿,以便于研究者迅速地对海豚的模仿给予反馈,从而实现与海豚的交流。

比如,研究者 A 使用 CHAT 发出代表围巾的音,研究者 B 会将围巾递给 A。研究者设想海豚在偷偷观察后会学会 " 围巾 " 怎么说|DolphinGemma

WDP 今年将在野外应用 DolphinGemma。这个模型仅有约 400M,直接在谷歌推出的 Pixel 手机上就能运行,这能适应水下环境便于实地应用。研究团队希望,DolphinGemma 可以通过识别反复出现的声音模式和序列,帮助研究人员发现海豚自然交流中的隐藏结构和潜在的含义。

真的可以交流吗?

但这不意味着我们已经破译海豚的语言了。相反地,正如 WDP 的研究总监 Denise Herzing 所说:我们并不确定海豚是否有语言。

海豚常发出三种不同类型的声音,虽然这些声音与特定行为高度相关,但科学家尚不确定它们是否拥有明确、具体的含义——比如是否代表 " 某个物体 " 或 " 某个动作 "。更重要的是,即使这些声音可以被视为 " 词汇 ",我们仍然不清楚海豚是否具备类似的语法结构来组织这些词汇,从而表达更为复杂的含义。

因此,DolphinGemma 对 " 海豚语言 " 的破译,更多的只是对声音序列的分析。研究团队希望,通过 AI 对这些豚言豚语的学习,发现海豚交流方式中一些细微的人类无法识别的模式——得益于这几年大语言模型的发展,这比人类手动学习要快得多。

如果 DolphinGemma 发现了某种固定的声音模式,WDP 多年的观察结果则可以提供 " 发出这个声音时,海豚在做什么 " 的信息,这就有可能了解海豚的交流方式,甚至了解它们的语言和文化。不过从目前来看,我们最多只是理解了声音与行为之间的联系,还不算真正翻译出 " 海豚语言 "。

一群大西洋斑海豚(Stenella frontalis)|Google

另外,不管是 DolphinGemma 对声音序列的解析,还是 CHAT 项目试图与海豚互动,这些研究都是基于 WDP 在巴哈马追踪的大西洋斑海豚。但不同地区、不同种群的海豚,发声方式可能存在差异,可能也有自己的方言和口音。因此,DolphinGemma 目前的训练成果不一定能推广到其他海豚上。

谷歌表示,他们预计将在今年夏天开源 DolphinGemma。届时,DolphinGemma 还能用于其他鲸豚物种的声学研究。

AI 加持下的动物研究

DolphinGemma 并不是第一个想要破译动物语言的模型。在人工智能迅猛发展的这几年,越来越多的动物研究里都有了 AI 的身影。

一个名为 "鲸类翻译倡议"(Cetacean Translation Initiative,CETI)的非盈利研究项目,专注于解码抹香鲸的交流。抹香鲸最常发出的声音是一连串的咔哒声,这种像摩斯密码一样的声音被称为 " 密码曲 "。CETI 收集了 60 头抹香鲸的 8000 多条密码曲,通过传统的统计分析和机器学习,发现咔哒声的数量、节奏和节奏的变化组成了不同的密码曲。他们认为,抹香鲸可以通过无限的组合创造出各种密码曲,从而拥有庞大的交流系统;但目前仍无法破解这些咔哒声和密码曲包含了什么信息。

CETI 项目尝试 " 解码 " 抹香鲸的交流系统。图中展示了从水下机器人和无人机收集语音与行为数据开始,经过数据处理、共享与可视化,结合鲸类社会行为、生物学观察、机器学习和语言学分析,逐步构建鲸类语言模型,尝试理解其语法、语义及交流内容|CETI

另一个研究团体 "地球物种项目"(Earth Species Project)关注的物种更多,包括乌鸦、白鲸、大象等。他们同样希望利用人工智能,解码动物的交流。他们认为这有助于动物保护,比如帮助濒危物种保留它们的语言,或者通过破译鲸豚类动物的语言,在它们即将浮出水面时,提醒附近船只避开动物。

此外,还有用于分析啮齿类动物、非人灵长类动物叫声语义的模型。2022 年发表在《自然 - 通讯》的一篇研究,通过机器学习,发现了斑胸草雀不同圈养种群之间求偶歌曲的差异,而且这种差异会影响雌性的选择。研究者认为,人工智能可以找出人类尚未发现细微的差别。

斑胸草雀(Taeniopygia guttata)|christoph_moning / Wikimedia Commons

破译语言难度还很大,而通过人工智能分析声音、识别物种的技术则成熟得多,这些技术也常常用在动物保护工作中。

由康奈尔鸟类实验室开发的BirdNet,通过机器学习来检测和分类鸟的鸣叫声,目前可以识别约 3000 种常见鸟类物种。BirdNet 可以直接在手机上使用,为观鸟爱好者、公民科学家和保护工作者提供识别的工具。

今年年初,AI 还帮人们发现了一种在当地消失近 30 年的鸟。在澳大利亚墨尔本西部的草原上,保护组织安装了 35 个录音机,收集了数万个小时的录音。他们使用 AI 对录音进行筛选,AI 从其中两个地点发现了一种轻柔低沉的 "Ooming" 声——这是领鹑的叫声,人类专家随后确认了 AI 的发现。

领鹑是澳大利亚特有种,因为栖息地的丧失,其种群数量大幅下降,现在属于极度濒危物种,上次在这片地区出现还是 1989 年。如果没有 AI,人类要从海量的声音信息里发现领鹑,工作量将会大得多。

AI 帮助研究者找到了领鹑(Pedionomus torquatus)的踪迹|JJ Harrison / Wikimedia Commons

我们好像总是想知道动物在说什么,家中的宠物在表达什么需求,大自然里的动物在交换什么情报……这可能只是出于本能的好奇,但如果能够了解动物之间的交流,我们就可以更懂动物,懂得它们的需求,或许也更懂得它们之间的情感和连结,懂得它们与人类的相似与平等。

但对我们人类来说,动物之间的交流还有太多的未知,自然还有太多的神秘。人工智能可以解开这些秘密吗?拭目以待吧。

参考文献

[ 1 ] https://blog.google/technology/ai/dolphingemma/

[ 2 ] https://apnews.com/article/sperm-whale-language-talk-clicks-a94df8e07b129f19917437fcb85e7655

[ 3 ] https://apnews.com/article/artificial-intelligence-climate-change-reid-hoffman-ab1d38583c4102185a494e465358963e

[ 4 ] https://www.nature.com/articles/s41467-022-28881-w

[ 5 ] https://www.theguardian.com/environment/2025/feb/12/plains-wanderers-spotted-in-melbournes-west-for-first-time-in-30-years-with-help-of-ai

作者:麦麦

编辑:黄线狭鳕

题图来源:Veronica Maglieri, Federica Vantaggio, Elisabetta Palagi, Livio Favaro

本文来自果壳自然(ID:GuokrNature)

如需转载请联系 sns@guokr.com

欢迎转发到朋友圈

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 人工智能 巴哈马 库里 听力
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论