AI在线 AI在线

谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%

谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。

科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。

该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。

AI在线注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(Prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。

谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%

相关资讯

曝安卓版谷歌 Gemini AI 助手正在灰度测试“聊天历史记录搜索”功能

AI在线 7 月 14 日消息,科技媒体 9To5Google 上周(当地时间 7 月 11 日)发文,曝光了安卓版谷歌 Gemini AI 助手正在灰度测试“聊天历史记录搜索”功能,可更加便捷地找到用户需要的聊天历史记录。 ▲ 灰度测试用户截图,下同据该媒体所述,部分用户在打开安卓版 Gemini App 后,再点击汉堡菜单(AI在线注:抽屉菜单)按钮时,顶部出现了“搜索聊天记录(Search for chats)”的搜索按钮。 在点击后可以看到一个全屏覆盖的搜索菜单,界面较为简洁,使用逻辑上与 ChatGPT 等 AI 助手的搜索功能无异。
7/14/2025 11:00:50 AM
潞源(实习)

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋

谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用

谷歌Gemini 2.5 Pro和Flash全面开放,新增视频分析功能,用户可在安卓和网页端上传视频进行分析。Gemini能概述视频内容、查找特定部分或物品,并在回复中显示相关视频片段。目前该功能已上线,但暂不支持直接录制视频。#谷歌Gemini# #AI视频分析#
6/18/2025 1:21:35 PM
远洋
  • 1