AI在线 AI在线

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

Flash-Lite在编码、数学、科学推理及多模态任务中表现全面超越前代2.0 Flash-Lite,推理速度提升且延迟更低,适合实时翻译、分类等高吞吐量场景。
感谢谷歌公司今天(6 月 18 日)发布博文,在宣布 Gemini 2.5 Flash 和 Gemini 2.5 Pro 模型进入稳定阶段之外,还推出全新轻量级模型 Gemini 2.5 Flash-Lite

AI在线援引博文介绍,谷歌官方表示,Gemini 2.5 Flash 和 Gemini 2.5 Pro 两款模型已通过大规模测试,可稳定支持生产级应用开发。Spline、Rooms 等公司,以及 Snap、SmartBear 等企业,已在过去数周内使用最新版本开发实际应用。

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

谷歌表示 Gemini 2.5 系列以平衡“成本-速度-性能”为核心设计目标,兼顾高效推理与经济性,伴随着稳定版上线,确保开发者能以更高信心构建复杂系统。

谷歌同步推出 Gemini 2.5 Flash-Lite 的预览版本,这是目前该系列中成本效益最高、推理速度最快的模型。

测试显示,Flash-Lite 在代码编写、科学计算、多模态分析等任务中,综合质量超越前代 2.0 Flash-Lite;其延迟表现也优于 2.0 版本,在翻译、分类等需要快速响应的场景中尤为突出。

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

该模型继承 Gemini 2.5 系列核心能力,包括灵活控制推理预算、连接外部工具(如谷歌搜索、代码执行)以及支持 100 万 token 超长上下文处理。

开发者可通过 Google AI Studio、Vertex AI 平台访问 2.5 Flash 和 Pro 的稳定版本,以及 Flash-Lite 的预览版本。此外,Gemini 应用端也已集成 2.5 Flash 和 Pro,而谷歌搜索则部署了定制化版本的 Flash-Lite 和 Flash 模型以提升服务效率。

谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理

相关资讯

曝安卓版谷歌 Gemini AI 助手正在灰度测试“聊天历史记录搜索”功能

AI在线 7 月 14 日消息,科技媒体 9To5Google 上周(当地时间 7 月 11 日)发文,曝光了安卓版谷歌 Gemini AI 助手正在灰度测试“聊天历史记录搜索”功能,可更加便捷地找到用户需要的聊天历史记录。 ▲ 灰度测试用户截图,下同据该媒体所述,部分用户在打开安卓版 Gemini App 后,再点击汉堡菜单(AI在线注:抽屉菜单)按钮时,顶部出现了“搜索聊天记录(Search for chats)”的搜索按钮。 在点击后可以看到一个全屏覆盖的搜索菜单,界面较为简洁,使用逻辑上与 ChatGPT 等 AI 助手的搜索功能无异。
7/14/2025 11:00:50 AM
潞源(实习)

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋

谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用

谷歌Gemini 2.5 Pro和Flash全面开放,新增视频分析功能,用户可在安卓和网页端上传视频进行分析。Gemini能概述视频内容、查找特定部分或物品,并在回复中显示相关视频片段。目前该功能已上线,但暂不支持直接录制视频。#谷歌Gemini# #AI视频分析#
6/18/2025 1:21:35 PM
远洋
  • 1