Neden önemli: Opus 4.5’in yazılım mühendisliği testlerinde zirveye yerleşmesi, üst seviye yapay zeka yarışında dengeleri yeniden kurabilir. Üstelik fiyatların düşmesi, bu sınıftaki modelleri daha geniş geliştirici ve kurumsal kitle için erişilebilir hale getirerek rekabeti hızlandırabilir.
Anthropic, en gelişmiş modeli olarak konumlandırdığı Claude Opus 4.5’i tanıttı. Şirket, modelin özellikle yazılım geliştirme, araştırma ve üretkenlik odaklı iş akışlarında önceki sürümlere göre daha tutarlı ve güçlü sonuçlar verdiğini söylüyor.
Kodlama testlerinde yeni zirve
Anthropic’e göre Opus 4.5, gerçek dünya yazılım görevlerini ölçen SWE-Bench Verified testinde yüzde 80,9 başarı oranına ulaştı. Bu skor, şirketin önceki Opus ve Sonnet sürümlerinin üstünde konumlanırken, rakip modellerle yarışan seviyeye çıktığını gösteriyor. Şirket, modelin sadece benchmarklarda değil; kod yazma, hata ayıklama, refaktör ve proje bütünleme gibi pratik senaryolarda da daha güvenilir bir çizgi yakaladığını vurguluyor.
Chrome ve Excel tarafında üretkenlik hamlesi
Yeni modelle birlikte Anthropic, masaüstü üretkenlik araçlarını da genişletti. Claude for Chrome uzantısı Max abonelerine açılırken, Claude for Excel tarafı Max, Team ve Enterprise paketlerine yayıldı. Anthropic, özellikle tablo analizi, veri düzenleme ve çok adımlı ofis görevlerinde daha stabil bir deneyim hedefliyor.
Fiyatlar düşüyor, kontrol artıyor
Anthropic, Opus 4.5 ile fiyat politikasında da daha agresif bir çizgiye geçti. Şirket, giriş ve çıkış token maliyetlerini önceki Opus sürümlerine kıyasla kayda değer biçimde aşağı çekti. Ayrıca “effort” adı verilen yeni bir kontrol parametresiyle geliştiricilere, hız-maliyet-performans dengesini göreve göre ayarlama seçeneği sunduğunu belirtiyor.
Claude Opus 4.5, yüksek kodlama performansı, üretkenlik araçlarına daha sıkı entegrasyon ve daha erişilebilir fiyat birleşimiyle Anthropic’in rekabetteki iddiasını sertleştiriyor. Modelin gerçek kullanımda nasıl bir fark yaratacağı kısa süre içinde geliştirici geri bildirimleriyle netleşecek, ancak ilk veriler üst düzey yapay zeka yarışında yeni bir faza girildiğini gösteriyor.





