AI在线 AI在线

隐式

Gemini API推出隐式缓存功能,开发者成本降低75%

Gemini API推出隐式缓存(Implicit Caching)功能,为开发者带来显著的成本优化体验。 新功能无需开发者手动创建缓存,当请求与先前请求共享共同前缀时,系统将自动触发缓存命中,提供高达75%的Token折扣。 此更新已覆盖Gemini2.5Pro和2.5Flash模型,进一步提升了AI开发的成本效益。
5/9/2025 4:00:51 PM
AI在线

Google Gemini API迎来隐式缓存功能 自动节省开发成本高达75%

近期,Google 宣布在其 Gemini API 中推出一项新功能 —— 隐式缓存。 这一功能旨在帮助第三方开发者在使用最新 AI 模型时节省成本,最高可达75% 的费用节约,尤其是在处理重复性上下文时效果显著。  隐式缓存的工作原理隐式缓存的核心在于,它能够自动识别并重用之前请求中相似的内容。
5/9/2025 10:01:42 AM
AI在线
  • 1