谷歌发布革新AI技术以破译海豚沟通方式
发布时间:2025-04-15 09:22:30 | 责任编辑:字母汇 | 浏览量:23 次
谷歌的人工智能研究实验室 Google DeepMind 近日宣布,推出了一款名为 DolphinGemma 的新型 AI 模型,旨在帮助研究人员解读海豚的发声。这一创新成果为人类更好地理解海豚之间的沟通方式提供了有力支持。
DolphinGemma 模型的训练数据来自于 Wild Dolphin Project(WDP),这是一个致力于研究大西洋斑点海豚及其行为的非营利组织。DolphinGemma 基于谷歌的开放式 Gemma 系列模型构建,能够生成类似海豚的声音序列,并且具备在手机上高效运行的能力。
根据谷歌的介绍,WDP 计划在今夏使用谷歌的 Pixel9智能手机来搭建一个平台,创建合成的海豚声音,并对海豚的声音进行匹配的 “回复”。此前,WDP 使用的是 Pixel6进行相关研究,而升级到 Pixel9后,将使得研究人员能够同时运行 AI 模型和模板匹配算法,从而提高研究的效率和准确性。
这一新技术的推出标志着在动物交流研究领域的一次重大进展,研究人员期待通过这种方法,揭示海豚之间更复杂的沟通方式。谷歌的 DolphinGemma 不仅为海洋生物学的研究带来了新机遇,也展示了 AI 技术在自然科学领域的广泛应用潜力。
官方博客:https://blog.google/technology/ai/dolphingemma/
划重点:
🐬 DolphinGemma 是谷歌新推出的 AI 模型,旨在解码海豚的声音交流。
📱 WDP 计划使用谷歌 Pixel9手机进行合成海豚声音的研究,提高研究效率。
🌊 这一技术的应用为理解海豚沟通方式提供了新的可能性,展示了 AI 在动物交流研究中的价值。
谷歌DeepMind于2025年4月15日推出了一款名为DolphinGemma的AI模型,专门用于解码海豚的“语言”。以下是关于该模型的详细介绍:
模型背景与合作
-
合作方:DolphinGemma是谷歌DeepMind与佐治亚理工学院和野生海豚项目(Wild Dolphin Project,WDP)合作的成果。
-
研究基础:WDP自1985年以来一直在研究大西洋斑点海豚,积累了大量的水下音频和视频资料,这些资料与个体海豚的身份、生活史和行为相匹配,为DolphinGemma提供了丰富的训练数据。
模型特点
-
技术架构:DolphinGemma基于谷歌开源的Gemma系列模型框架构建。它利用谷歌的SoundStream分词器有效表示海豚声音,然后通过专为复杂序列设计的架构处理这些声音。
-
功能:该模型能够生成类似海豚的声音序列,并且可以识别海豚声音中的模式和结构,预测序列中可能的后续声音。
-
运行效率:DolphinGemma的运行效率非常高,甚至可以在智能手机上流畅运行。
研究应用
-
交互平台:WDP计划在2025年夏天利用谷歌最新的Pixel 9智能手机搭建一个能够与海豚进行声音交互的平台。该平台不仅能合成海豚的声音,还能捕捉并记录海豚的自然发声,进而通过算法匹配找到相应的“回应”。此前,WDP已使用Pixel 6手机进行初步研究,升级到Pixel 9后,将支持同时运行AI模型和模板匹配算法,显著提升研究工作的效率。
-
研究意义:通过DolphinGemma,科学家们有望更加深入地了解海豚的沟通方式,进一步揭示其复杂的社会结构和行为模式。此外,该模型还可能帮助确定海豚的沟通是否达到了语言的水平。
未来展望
-
扩展应用:谷歌计划在2025年夏天分享DolphinGemma的更新版本,可能会将其应用扩展到其他海豚物种,但可能需要针对不同物种的发声进行微调。
-
更广泛的研究:DolphinGemma的成功开发为动物行为学研究领域带来了新的突破,未来可能会有更多的AI技术应用于其他动物的沟通研究。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
上一篇: 人工智能如何助力精准营销?
下一篇: AI在金融市场预测中的应用有哪些?