AI在线 AI在线

谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!

近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。 这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。 以下,AIbase为您详细解读这三款模型的亮点与应用前景。

近日,谷歌在人工智能领域再掀波澜,宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。这些模型分别针对医疗、手语翻译和海豚语言研究领域,展现了AI技术在跨领域应用的巨大潜力。以下,AIbase为您详细解读这三款模型的亮点与应用前景。

MedGemma:革新医疗AI,助力精准诊疗

MedGemma是谷歌专为医疗领域打造的AI模型,提供两个版本以满足不同需求。4B多模态模型能够处理图像与文本的组合任务,经过针对胸部X光片、皮肤科图像、眼科图像和病理切片等医疗数据的预训练,展现了在医疗影像诊断、报告生成和患者分诊等任务中的强大能力。27B文字推理模型则专注于纯文本处理,凭借更强的推理能力,适用于病历分析、医疗问答等需要深入理解的场景。这两款模型均可在单块GPU上高效运行,为医疗开发者提供了灵活的开发选择。

image.png

谷歌表示,MedGemma通过其Health AI Developer Foundations计划发布,旨在加速医疗应用的开发。未来,开发者可利用这些模型构建更智能的医疗工具,为精准医疗注入新动能。

SignGemma:打破沟通壁垒,手语翻译更进一步

SignGemma是一款专为手语翻译设计的开放模型,重点支持美国手语(ASL)到英语的翻译。这款模型能够将手语动作转化为口语文本,为聾病患者和开发者提供了全新的交互方式。据悉,SignGemma在手语理解方面表现卓越,被誉为“迄今为止最强大的手语理解模型”。

谷歌计划在未来进一步扩展SignGemma的多语言支持,助力全球聾病社区实现无障碍沟通。开发者可基于此模型开发创新应用,例如实时手语翻译工具或教育平台,为聾病群体带来更多便利。

DolphinGemma:解码海豚语言,探索跨物种沟通

DolphinGemma是谷歌与Wild Dolphin Project(WDP)和乔治亚理工学院合作开发的创新模型,旨在分析和生成海豚的复杂声音。这款模型基于40年积累的北大西洋斑点海豚声学数据,能够识别签名哨声、脉冲爆裂声等特定声音模式,并预测声音序列,类似于人类语言模型的预测机制。

DolphinGemma已集成到WDP的CHAT(Cetacean Hearing Augmentation Telemetry)系统中,通过智能手机界面实现实时海豚声音分析。研究人员甚至尝试通过合成哨声与海豚进行简单交互,例如请求海豚与特定物体互动。谷歌计划于2025年夏季将DolphinGemma开源,允许更多研究者将其应用于其他鲸类物种,加速跨物种沟通的研究进程。

开源与未来:AI赋能跨领域创新

谷歌强调,这三款模型均基于Gemma架构,兼顾高效性和适应性。MedGemma现已通过Health AI Developer Foundations计划开放使用,SignGemma和DolphinGemma也将在未来陆续开源。 然而,Gemma系列的非标准许可条款也引发了一些开发者对商业应用的担忧,未来谷歌可能需要进一步优化许可政策以提升模型的商业化潜力。

技术与社会价值的双赢

从医疗诊断到手语翻译,再到海豚语言研究,谷歌的三大Gemma模型变体展现了AI技术在解决实际问题和探索未知领域的无限可能。MedGemma为医疗行业带来了高效工具,SignGemma推动了无障碍沟通,而DolphinGemma则为人类与自然界的对话打开了新窗口。AIbase认为,这些创新不仅体现了技术的前瞻性,也彰显了AI在社会价值与科学研究中的重要作用。

相关资讯

中国队夺金幕后的「AI手语翻译官」:初次上岗,手语可懂度超90%

有了腾讯 3D 手语数智人主播「聆语」的精彩解说,即使是身处「无声世界」的群体也能实时感受冰雪赛事的每一份激情。
2/9/2022 5:05:00 PM
机器之心

vivo 宣布开放无障碍产品安卓公版,全栈 AI 能力免费用

在今日的 2024 vivo 开发者大会上,vivo 公布了在无障碍方面的最新进展。vivo「手语翻译官」升级了手语学习功能,用户可以用它自由学习手语,也同步协助了国家通用手语的普及与推广。此外,蓝心语音大模型将支持多种语言,让「vivo 听说 - 方言自由说」这个功能支持多种方言的识别和发声。vivo 还在多模态蓝心大模型的基础上,推出了「vivo 看见-蓝心升级版」。它能够更精准详细、更生动形象地描述镜头前的景象,并可以进行多轮问答的交流。此外,vivo 成为了中国残联的战略合作伙伴,面向 10 所高校的 10
10/10/2024 1:22:57 PM
汪淼

谷歌 DeepMind 开发 DolphinGemma AI 模型,助力海豚“语言”研究

谷歌DeepMind推出DolphinGemma AI模型,可生成海豚声音序列,助力科学家研究海豚沟通方式。该模型基于Gemma系列构建,训练数据来自Wild Dolphin Project,甚至能在手机上运行。今夏WDP将用Pixel 9搭建平台,进一步提升研究效率。#AI科技# #动物行为研究#
4/15/2025 7:51:50 AM
远洋
  • 1