AI在线 AI在线

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。据称,这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。谷歌称,Gemini 1.5 Pro 可以理解复杂的指令,并且无需对

谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

谷歌现已推出 Gemini 1.5 Pro 公共预览版,并借此为其赋予了“耳朵”,从而帮助用户处理音频内容,例如可以直接上传一份音频文件让它来分析,或者上传一份财报电话会议录音或视频来让它总结。

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

据称,这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。谷歌称,Gemini 1.5 Pro 可以理解复杂的指令,并且无需对模型进行微调。

当然,Gemini 1.5 Pro 目前仅限于 Vertex AI 用户体验,而 Gemini Ultra 则因为 Gemini 聊天机器人的原因为所有 Pro 用户提供服务。不过,尽管 Gemini Ultra 功能更多并且能够理解长指令,但处理速度不如 Gemini 1.5 Pro。

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

实际上,Gemini 1.5 Pro 并非唯一获得更新的谷歌大模型,辅助 Gemini 生成图像的文生图模型 Imagen 2 也将加入图片修复和扩充功能,使用户可以添加或移除图像元素。

IT之家注意到,谷歌还为 Imagen 模型的所有图片提供了数字水印功能“SynthID”。简单来说,SynthID 在图像中添加了一个用户不可见的防伪标识,但可以通过检测工具来确认其来源。

值得注意的是,Imagen 的许多新功能,例如图片修复和扩充,已经出现在其他文生图模型中,例如 Stability AI 的 Stable Diffusion 和 Getty 公司的 Generative AI by iStock 上,更不用说最新款三星 Galaxy 手机还有类似的功能。

谷歌表示,他们还将在公开预览中尝试将 AI 响应与谷歌搜索结果结合,以便利用最新情报进行解答。

参考资料:

《Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context》

相关资讯

手慢无!教你免费用上目前最火最强的 Gemini 3 Pro 全家桶!

自从Gemini 3 跟Nano Banana Pro出来后,免费用的版本已经是非常好用,那如果是付费会员,那不得上天? 更多方法;但大家可能发现了一个问题,就是咱们想给Gemini冲会员比给GPT充钱还麻烦,能不能先让我免费试用一下,体验一下区别,然后再让我看看值不值得花精力去搞充值方法啊? 没想到,今天还在官网上看到了一个免费体验的办法,而且还是能免费体验一个月,可以免费使用 Gemini 3 Pro、Nano Banana Pro、Veo 3、Deep Research谷歌最新AI全家桶!
12/3/2025 8:54:20 AM
彩云Sky

想去哪就去哪!我用Nano Banana Pro做了个实时旅行相机

前几天 Nano Banana Pro 发布之后早上看到了 Deepmind 官方的一个用法,就是给到 Nano Banana Pro 经纬度让他直接生成对应地点的照片。 主要基于 Nano Banana Pro 的实时检索能力,他可以通过经纬度知道这个地点的具体位置。 我试了一下果然可以,而且我还给他生成的照片加上了对应的水印,同时让他检索对应位置的当前时间和天气,让生成的照片更加符合现实场景。
12/1/2025 1:58:26 AM
歸藏

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋