智快網 - 新科技與新能源行業網絡媒體

          谷歌Gemini 2.5 API新推隱式緩存功能,開發者成本有望大幅削減

             發布時間:2025-05-10 12:10 作者:柳晴雪

          近期,科技界傳來一則新動態,谷歌在其Gemini 2.5 API中引入了名為“隱式緩存”的新功能,旨在通過智能化手段降低開發者的成本。據科技媒體WinBuzzer于5月9日報道,這一創新技術能自動識別并重用API請求中的常見前綴,從而幫助開發者實現成本的大幅縮減,最高可達75%。

          具體而言,“隱式緩存”功能適用于Gemini 2.5系列中的Pro和Flash模型。該功能無需開發者進行任何手動配置,系統默認啟用,大大簡化了操作流程。它通過自動檢測并重用API請求中的重復前綴,有效提升了效率,降低了成本。

          值得注意的是,“隱式緩存”與谷歌早前在2024年5月推出的“顯式緩存”有所不同。后者需要開發者自行配置,而前者則完全由系統自動處理,不僅節省了成本,還顯著提升了用戶體驗。為了最大化隱式緩存的效果,谷歌建議開發者在構建提示詞時,將穩定且常見的內容置于開頭,隨后再添加用戶特定的變量內容。

          谷歌還指出,如果開發者在短時間內發送具有相似前綴的請求,將有助于提高緩存的命中率,進一步提升效率。不過,為了享受這一功能,開發者需要滿足一定的Token數量要求:Gemini 2.5 Flash模型需至少1024個Token,而Gemini 2.5 Pro模型則需至少2048個Token。

          為了幫助開發者更好地了解緩存的使用情況,谷歌在API響應中新增了“cached_content_token_count”字段。這一字段將顯示緩存Token的使用詳情以及優惠計費信息,讓開發者能夠清晰掌握成本節約的具體情況。

          盡管谷歌宣稱“隱式緩存”功能能夠帶來高達75%的成本節省,但實際效果仍需第三方進行驗證。同時,由于不同開發者的使用模式可能存在差異,因此具體節省的幅度也可能有所不同。

          谷歌并未完全放棄“顯式緩存”方案。作為可選方案,顯式緩存仍然支持Gemini 2.5及2.0模型,并允許開發者自定義緩存內容和生存時間(TTL,默認1小時)。這一靈活性使得開發者能夠根據自身需求選擇最適合的緩存方案。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国产主播精品福利19禁vip| 国产精品一久久香蕉国产线看| 一级A毛片免费观看久久精品| 国产女人乱人伦精品一区二区| 亚洲精品国产精品| 精品一区二区视频在线观看| 久久久久亚洲精品日久生情| 99久久免费精品高清特色大片| 国产精品成熟老女人视频| 国产在线观看一区二区三区精品| 亚洲国产精品无码久久九九| 老司机福利精品视频| 中文字幕日韩wm二在线看| 日韩视频在线观看一区二区| 四虎国产精品免费视| 日韩a毛片免费观看| 国产在线午夜卡精品影院| 国产精品亚洲а∨无码播放麻豆 | 精品免费久久久久久久| 嫩草伊人久久精品少妇AV| 国产AV国片精品| 国产成人久久精品激情| 国产精品免费大片| 国产精品久久久亚洲| 久久九九青青国产精品| 曰韩精品无码一区二区三区| 亚洲精品蜜桃久久久久久| 亚洲精品二区国产综合野狼| 亚洲色精品aⅴ一区区三区| 中文字幕精品亚洲无线码二区| 99精品福利国产在线导航| 久久精品国产精品亚洲人人 | 日韩电影免费在线| 日韩中文字幕在线| 日韩毛片人妻久久蜜桃传媒| 日韩高清在线播放| 九九精品视频在线| 精品国产人成亚洲区| 国产69精品久久久久久人妻精品| 亚洲精品无码成人片久久| 久久国产精品老人性|