Yapay zeka geliştiricileri için önemli avantajlar sunuyor. Google, Gemini API kullanıcıları için maliyetleri azaltacak yeni bir özellik sundu. "Örtük önbelleğe alma" sistemiyle, tekrarlayan bağlam içeren isteklerde %75'e varan tasarruf sağlanabiliyor. Gemini 2.5 Pro ve 2.5 Flash modelleriyle uyumlu bu sistem, otomatik çalışarak geliştiricilere API maliyetlerinde ciddi avantaj sunuyor.
Önceden yalnızca açık önbellekle çalışan sistemde yaşanan fatura sorunları sonrası gelen bu değişiklik, kullanıcı tepkileriyle hızlandı. Yeni sistem sayesinde geliştiricilerin manuel işlem yapmasına gerek kalmadan, önceden kullanılan bağlamlar tekrar değerlendirilecek. Ancak sistemin vaat ettiği tasarrufun doğruluğu konusunda henüz üçüncü taraf doğrulama bulunmuyor.
Google, geliştiricilerin Gemini API üzerinden en son yapay zeka modellerine daha uygun maliyetle erişebilmesi için "örtük önbelleğe alma" (implicit caching) adlı yeni bir özelliği kullanıma sundu. Bu özellik, tekrarlayan bağlamlarda %75'e varan maliyet tasarrufu sağlayarak, özellikle Gemini 2.5 Pro ve 2.5 Flash modellerini kullanan geliştiriciler için önemli bir avantaj sunuyor.
Öne Çıkan Özellikler
-
Otomatik Tasarruf: Önceki açık önbelleğe alma sistemlerinin aksine, örtük önbelleğe alma tamamen otomatik çalışır ve geliştiricilerin manuel yapılandırma yapmasına gerek kalmaz.
-
Minimum Belirteç Sayısı: Önbellek isabeti için gereken minimum belirteç sayısı, Gemini 2.5 Flash için 1.024 ve 2.5 Pro için 2.048 olarak belirlenmiştir.
-
İstek Yapısı: Google, geliştiricilerin önbellek isabeti olasılığını artırmak için tekrarlayan bağlamı isteklerin başında tutmalarını ve değişken içeriği sona eklemelerini öneriyor.
Geliştiriciler İçin Öneriler
-
İsteklerinizi Optimize Edin: Önbellek isabeti olasılığını artırmak için, sık kullanılan veya tekrarlayan içeriği isteklerin başında tutun.
-
Kullanım Verilerini Takip Edin: API yanıtlarındaki
usage_metadata
alanını kullanarak, önbelleğe alınan belirteç sayısını izleyebilir ve tasarruflarınızı değerlendirebilirsiniz.