首页 > 快讯 > Gemini API新增智能缓存机制 开发者成本可自动降低75%

Gemini API新增智能缓存机制 开发者成本可自动降低75%

发布时间:2025-05-09 12:03:33 | 责任编辑:张毅 | 浏览量:3 次

近期,Google 宣布在其 Gemini API 中推出一项新功能 —— 隐式缓存。这一功能旨在帮助第三方开发者在使用最新 AI 模型时节省成本,最高可达75% 的费用节约,尤其是在处理重复性上下文时效果显著。
隐式缓存的工作原理
隐式缓存的核心在于,它能够自动识别并重用之前请求中相似的内容。Google 表示,这项新功能已默认开启,适用于 Gemini2.5Pro 和2.5Flash 模型。当开发者向 Gemini2.5模型发送请求时,如果该请求与之前的某个请求存在相同的前缀,就有可能命中缓存,从而实现成本节约。
与此前的显式缓存不同,开发者在使用隐式缓存时不再需要手动定义高频请求。显式缓存的方式虽然承诺了节省成本,但由于其需要大量手动配置,导致许多开发者对此颇感不满,尤其是在最近几周关于 API 费用过高的投诉不断增加。
隐式缓存的优势
隐式缓存的最大优势在于其自动化程度。Google 在其官方博客中指出,当请求的上下文信息与先前请求相似时,系统会自动返回成本节约。这种方式简化了开发者的操作流程,减轻了他们的负担。
根据 Google 的开发者文档,隐式缓存的最低提示令牌数为2,048(针对2.5Pro 模型)和1,024(针对2.5Flash 模型),这意味着开发者只需提供少量信息即可触发自动节省。令牌是模型处理的数据基本单元,大约1,000个令牌相当于750个单词。
使用建议与注意事项
为了更好地利用隐式缓存,Google 建议开发者在请求的开头尽量放置重复的上下文内容,以增加命中缓存的几率。而可能会在请求间变化的上下文信息,则建议放在请求的末尾。
尽管 Google 对此次隐式缓存的效果充满信心,但尚未提供第三方验证,因此开发者在使用过程中仍需保持谨慎。随着越来越多的开发者开始使用这一新功能,我们期待他们的反馈能够验证 Google 的承诺。
总的来说,Google 的隐式缓存功能无疑为开发者提供了一个降低成本的新选择。在 AI 模型的使用成本持续上升的背景下,这项创新功能的推出将对开发者社区产生积极影响。未来,随着反馈的积累,我们也将看到这一功能的实际效果。
官方博客:https://developers.googleblog.com/en/gemini-2-5-models-now-support-implicit-caching/

Gemini API新增智能缓存机制 开发者成本可自动降低75%

Google Gemini API最近推出了一项名为“隐式缓存”的新功能,旨在帮助开发者在使用最新AI模型时节省成本。以下是关于该功能的详细介绍:

功能介绍

  • 工作原理:隐式缓存能够自动识别并重用之前请求中相似的内容。当开发者向Gemini 2.5模型发送请求时,如果该请求与之前的某个请求存在相同的前缀,就有可能命中缓存,从而实现成本节约。

  • 适用范围:该功能默认开启,适用于Gemini 2.5 Pro和2.5 Flash模型。

  • 成本节省:隐式缓存可为处理重复上下文的请求节省高达75%的成本。

优势

  • 自动化程度高:与显式缓存不同,隐式缓存无需开发者手动定义高频请求或进行额外配置,减少了开发者的负担。

  • 低门槛触发:隐式缓存的最低提示令牌数为2,048(针对2.5 Pro模型)和1,024(针对2.5 Flash模型),这意味着开发者只需提供少量信息即可触发自动节省。

  • 动态节省:开发者无需提前规划或调整代码,系统会自动识别并应用节省。

使用建议

  • 重复上下文位置:建议开发者将重复的上下文内容放在请求的开头,以增加命中缓存的几率。

  • 变化内容位置:可能会在请求间变化的上下文信息,建议放在请求的末尾。

注意事项

  • 缺乏第三方验证:Google尚未提供独立的第三方验证来证明隐式缓存能如承诺般实现自动成本节省,开发者在使用过程中需保持谨慎。

  • 依赖请求结构:隐式缓存的效果高度依赖于请求的结构设计。如果开发者未能合理组织请求内容,可能会导致缓存命中率较低。

总的来说,Google Gemini API的隐式缓存功能为开发者提供了一个降低成本的新选择,尤其在AI模型使用成本持续上升的背景下,这项创新功能的推出具有积极意义。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复