Anthropic, amiral gemisi modelinin en son sürümü olan Opus 4.5’i duyurdu. Model, Eylül’de çıkan Sonnet 4.5 ve Ekim’de çıkan Haiku 4.5’in ardından 4.5 serisinin son halkası olarak konumlanıyor.
YENİ KIYASLAMA PERFORMANSI
Opus 4.5, kodlama kıyaslamaları (SWE-Bench, Terminal-bench), araç kullanımı (tau2-bench, MCP Atlas) ve genel problem çözme (ARC-AGI 2, GPQA Diamond) dâhil çeşitli testlerde en son teknoloji performans sonuçlarıyla öne çıkıyor. Özellikle SWE-Bench doğrulamasında yüzde 80’in üzerinde puan alan ilk model olması dikkat çekiyor.
TARAYICI VE TABLO
Anthropic, Opus’un bilgisayar ve elektronik tablo kullanımındaki yeteneklerini vurguluyor. Opus 4.5 ile birlikte, daha önce pilot aşamasında olan Claude for Chrome ve Claude for Excel daha geniş kitlelere açılacak. Chrome eklentisi tüm Max kullanıcılarına, Excel odaklı model ise Max, Team ve Enterprise kullanıcılarına sunulacak.
UZUN BAĞLAM BELLEK
Opus 4.5, uzun bağlamlı işlemler için bellek yönetiminde yapılan iyileştirmelerle geliyor. Anthropic’in araştırma ürün yönetimi başkanı Dianne Na Penn, eğitimde uzun bağlam kalitesinin artırıldığını, ancak tek başına daha büyük bağlam pencerelerinin yeterli olmadığını belirtiyor; doğru ayrıntıların seçilmesi, bu pencerelerin tamamlayıcısı olarak tanımlanıyor.
Bu değişiklikler, ücretli Claude kullanıcılarının talep ettiği ‘sonsuz sohbet’ özelliğini de mümkün kılıyor. Model, bağlam penceresine ulaşıldığında sohbeti kesmek yerine bağlam belleğini arka planda sıkıştırarak konuşmaların kesintisiz sürmesini sağlayacak. Yükseltmelerin çoğu, Opus’un Haiku destekli alt araç grubuna liderlik ettiği araç kullanım senaryolarına yönelik olarak yapıldı. Bu tür görevlerde kod tabanlarını ve büyük belgeleri yönetebilmek için güçlü çalışma belleği hâkimiyeti hedefleniyor.

Penn, bu çerçevede belleğin, modelin ne zaman önceki bilgilere dönüp kontrol etmesi gerektiğini saptayabilmesi için temel bir unsur hâline geldiğini aktarıyor.
KÜRESEL MODEL REKABETİ
Opus 4.5, yakın zamanda piyasaya sürülen diğer öncü modellerle aynı segmentte yer alacak. Modelin, 12 Kasım’da çıkan OpenAI’nin GPT 5.1’i ve 18 Kasım’da duyurulan Google’ın Gemini 3’ü ile doğrudan rekabet edeceği ifade ediliyor. Böylece Anthropic’in yeni amiral gemisi, kodlama, araç kullanımı ve uzun bağlam performansı alanlarındaki kıyaslama sonuçlarıyla önde gelen modellerle karşılaştırılabilir bir konuma yerleşiyor.