AI在线 AI在线

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新 ——即日起,Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。此外新版聊天机器人还增加了“事实核查”功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。有网

Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新 ——

即日起,Gemini 聊天机器人将改由 Gemini 1.5 Flash 驱动。

与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。

当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

此外新版聊天机器人还增加了“事实核查”功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。

有网友感叹,谷歌今天表现真的很强,先是两款 Aplha 系模型(拿下了 IMO 银牌),接着 Gemini 也发布了更新。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

还有人开启了许愿模式,期待 Google Scholar 学术搜索当中也能加入 AI 功能。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

更长上下文窗口,速度也变快了

本次更新的最主要内容,就是把免费版背后的模型从 1.0Pro 换成了 1.5 Flash。

Gemini 1.5 Flash 最早亮相于 5 月的谷歌 I / O 开发者大会。

通过训练数据的“蒸馏”,Gemini 1.5 Flash 用更轻量化的体积实现了较高的生成质量。

而且小体积也让模型的速度更快、效率更高,同时它还支持多模态推理。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

谷歌介绍,此次更换模型之后,聊天机器人的速度会变得更快,同时旧版 8k 的上下文窗口,扩增到了 32k。

不过 1.5 Flash 自身是支持 1 百万的上下文的,这样的削减幅度属实是不小,但毕竟是免费免费版本。

除了模型的升级,另外一项重要更新就是事实核查功能了。

在最新的 Gemini 聊天机器人当中,可以通过该功能一键对输出的内容进行检查。

系统会针对输出中的内容在谷歌上进行搜索和比对,然后标记出相符和不符之处

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

有网友评论说,看到 OpenAI 上线 GPT-4o mini 时就觉得谷歌上新只是个时间问题。

的确,不仅是 OpenAI 和谷歌,Meta、Mistral 等在做大模型的厂商最近都是动作频繁。

而关于模型的表现,这位网友也表示自己试过 1.0 Pro 和 1.5 Flash,两者表现几乎相同,而 1.5 Flash 速度更快。

所以,谷歌的这波操作,一定程度上也是适应了最近兴起的“模型轻量化”趋势。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

那么,更换了 1.5 Flash 之后的 Gemini 聊天机器人,表现到底怎样呢?

一键检查模型输出

量子位对新版的聊天机器人进行了简单测试。

首先来看一下这次更新的事实核查功能,第一步是像正常对话一样随便提一个问题,Gemini 也会正常作答。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

可以看到在答案的下方有一个谷歌的 logo,这就是事实核查功能的按钮了。

点击之后系统会自动在谷歌进行搜索,然后与自己的输出内容进行比对。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

比对完成后,能够搜索到信源且相符的内容会被高亮为绿色,如果与搜索结果存在出入,则会以浅红底色标注。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

点击标注的位置,可以看到 Gemini 用于对比的内容链接。

需要注意的是,这样的标注并不意味着输出的内容是错误的,比如这里引用的对比资料中,汤姆克鲁斯的母亲是 Marry Lee South。

由于文本不匹配,导致答案中这一部分被系统标注,但实际上两个都是正确答案。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

由于这个事实核查依靠的是互联网搜索,对比资料的质量也是参差不齐,不一定能做到 100% 的准确。

比如关于“林黛玉倒拔垂杨柳”这个经典段子,Gemini 明明给出了正确答案,结果却被标红了。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

再一看引用的对比信息,属实是有些难绷了。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

所以这个功能的作用,主要是提供了一个更便捷的核查途径,但具体应当如何采信,还是要依靠多方查证,以及用户自己的判断

另外,关于模型本身,我们也测试了几个最近流行的让大模型屡屡碰壁的难题。

比如数字比大小,Gemini 甚至把两个数字换算成了钱,但一通操作之后最后的结果是…… 错的。

自从这个问题被发现以来,如果这个是第二搞笑的答案的话,应该没有哪个模型敢称第一了。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

还有一开始给了个错误答案,后面分析过程中纠正过来的。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

但如果用英语提问,还是有希望直接答对的。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

还有数字母的问题,这个回答竟然能从中文里数出字母来…… 也是把人给整不会了,完全不在预判之内。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

最后,关于此次更新中提到的速度提升,经测试发现,Gemini 1.5 Flash 输出第一个字的耗时要短于 Claude 3 Haiku,后续的速度用肉眼观察区别不是很明显。

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

以上就是 Gemini 1.5 Flash 在聊天机器人中的表现,感兴趣的读者可以自行尝试。

参考链接:

[1]https://blog.google/products/gemini/google-gemini-new-features-july-2024/

[2]https://x.com/GeminiApp/status/1816512086232731696

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西

相关资讯

阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音

阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音

近日,阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型,旨在通过文本指令生成或克隆声音。 其中,Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音,用户可以精确定义声音的特征,如情感和说话节奏。 例如,用户可以请求生成一个 “中年男性,洪亮的男中音 —— 充满活力的广告解说,快速的语速,夸张的音调变化,充满销售魅力的声音”。
12/24/2025 11:41:18 AM AI在线
ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近,谷歌一口气对 AI 模型能力做了一次大升级,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,这个模型对设计师来说,实用性很强。 更多新模型的介绍:. 被低估的谷歌?
3/26/2025 1:55:56 AM 彩云Sky
谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码

谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码

谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注:Gemini
5/15/2024 1:47:17 AM 故渊