Neden önemli: Gemini 2.5’in “insan gibi” web etkileşimi kurabilmesi, yapay zekanın gerçek dünya kullanımına bir adım daha yaklaştığını gösteriyor. Bu özellik, test otomasyonu, veri toplama ve web tabanlı görevlerde devrim niteliğinde kolaylık sağlayabilir. Google, bu gelişmeyle hem geliştiricilere güçlü bir araç sunuyor hem de yapay zekanın kullanıcı etkileşimindeki potansiyelini genişletiyor.
Google, Gemini 2.5 Computer Use modelini tanıtarak yapay zekanın web tarayıcısını tıpkı bir insan gibi kullanabilmesini mümkün hale getirdi. Yeni sistem; tıklama, metin yazma, kaydırma ve sürükle-bırak gibi eylemleri kullanıcı davranışına uygun şekilde gerçekleştirebiliyor. Google, bu modelin geleneksel API erişimine ihtiyaç duymadan web tabanlı görevleri otomatikleştirdiğini ve veri toplayabildiğini açıkladı.
Gemini 2.5, web görevlerini insan adımlarıyla tamamlıyor
Yeni model, aldığı komutları analiz ederek görevleri insan davranışına benzer biçimde adım adım gerçekleştiriyor. Örneğin bir formu doldurabiliyor, sayfalar arasında gezinebiliyor veya metin alanlarına doğru verileri girebiliyor. Gemini 2.5’in görsel algılama ve mantıksal çıkarım becerileri, onu geleneksel botlardan ayırıyor. Google’a göre bu teknoloji, kullanıcı arayüzü testlerinden API bağlantısı olmayan web servislerine kadar birçok alanda otomasyonu hızlandıracak.
Benchmark testlerinde rakiplerini geride bıraktı
Gemini 2.5, OpenAI’nin ChatGPT Agent ve Anthropic’in Claude modelleriyle kıyaslandığı testlerde yüksek başarı elde etti. Tarayıcı üzerinde insan davranışını en doğru şekilde simüle eden model, tıklama, kaydırma, sürükle-bırak ve metin girme gibi 13 farklı eylemi destekliyor. Bu özellik, web üzerinde karmaşık görevlerin doğruluk oranını ve hızını önemli ölçüde artırıyor.
Geliştiricilere açık erişim başladı
Google, Gemini 2.5’i AI Studio ve Vertex AI platformları üzerinden geliştiricilerin kullanımına sundu. Ayrıca Browserbase üzerinde herkese açık bir demo da yayınlandı. Model şu anda yalnızca web tarayıcı ortamında çalışabiliyor ve sistem düzeyinde kontrol yeteneğine sahip değil. Ancak Google, gelecekte daha fazla eylem desteği ve kapsamlı işlevsellik sunmayı planlıyor.




