Anthropic, Opus 4.5’i tanıttı: Kodlama ve araç kullanımında öne çıkıyor

Anthropic, 4.5 serisinin son üyesi Opus 4.5’i duyurarak kodlama, araç kullanımı ve uzun bağlamlı bellek yönetiminde yeni kıyaslama sonuçları açıkladı; model, SWE-Bench doğrulamasında yüzde 80’in üzerinde skor elde ederken Claude for Chrome ve Claude for Excel gibi ürünlerle de entegre biçimde sunulacak.

İstanbul Ticaret Gazetesi

Yayınlanma 26.11.2025, 15:20

Anthropic, Opus 4.5’i tanıttı: Kodlama ve araç kullanımında öne çıkıyor

Anthropic, amiral gemisi modelinin en son sürümü olan Opus 4.5’i duyurdu. Model, Eylül’de çıkan Sonnet 4.5 ve Ekim’de çıkan Haiku 4.5’in ardından 4.5 serisinin son halkası olarak konumlanıyor.

YENİ KIYASLAMA PERFORMANSI

Opus 4.5, kodlama kıyaslamaları (SWE-Bench, Terminal-bench), araç kullanımı (tau2-bench, MCP Atlas) ve genel problem çözme (ARC-AGI 2, GPQA Diamond) dâhil çeşitli testlerde en son teknoloji performans sonuçlarıyla öne çıkıyor. Özellikle SWE-Bench doğrulamasında yüzde 80’in üzerinde puan alan ilk model olması dikkat çekiyor.

TARAYICI VE TABLO

Anthropic, Opus’un bilgisayar ve elektronik tablo kullanımındaki yeteneklerini vurguluyor. Opus 4.5 ile birlikte, daha önce pilot aşamasında olan Claude for Chrome ve Claude for Excel daha geniş kitlelere açılacak. Chrome eklentisi tüm Max kullanıcılarına, Excel odaklı model ise Max, Team ve Enterprise kullanıcılarına sunulacak.

UZUN BAĞLAM BELLEK

Opus 4.5, uzun bağlamlı işlemler için bellek yönetiminde yapılan iyileştirmelerle geliyor. Anthropic’in araştırma ürün yönetimi başkanı Dianne Na Penn, eğitimde uzun bağlam kalitesinin artırıldığını, ancak tek başına daha büyük bağlam pencerelerinin yeterli olmadığını belirtiyor; doğru ayrıntıların seçilmesi, bu pencerelerin tamamlayıcısı olarak tanımlanıyor.

Bu değişiklikler, ücretli Claude kullanıcılarının talep ettiği ‘sonsuz sohbet’ özelliğini de mümkün kılıyor. Model, bağlam penceresine ulaşıldığında sohbeti kesmek yerine bağlam belleğini arka planda sıkıştırarak konuşmaların kesintisiz sürmesini sağlayacak. Yükseltmelerin çoğu, Opus’un Haiku destekli alt araç grubuna liderlik ettiği araç kullanım senaryolarına yönelik olarak yapıldı. Bu tür görevlerde kod tabanlarını ve büyük belgeleri yönetebilmek için güçlü çalışma belleği hâkimiyeti hedefleniyor.

Anthropic, Opus 4.5’i tanıttı: Kodlama ve araç kullanımında öne çıkıyor

Penn, bu çerçevede belleğin, modelin ne zaman önceki bilgilere dönüp kontrol etmesi gerektiğini saptayabilmesi için temel bir unsur hâline geldiğini aktarıyor.

KÜRESEL MODEL REKABETİ

Opus 4.5, yakın zamanda piyasaya sürülen diğer öncü modellerle aynı segmentte yer alacak. Modelin, 12 Kasım’da çıkan OpenAI’nin GPT 5.1’i ve 18 Kasım’da duyurulan Google’ın Gemini 3’ü ile doğrudan rekabet edeceği ifade ediliyor. Böylece Anthropic’in yeni amiral gemisi, kodlama, araç kullanımı ve uzun bağlam performansı alanlarındaki kıyaslama sonuçlarıyla önde gelen modellerle karşılaştırılabilir bir konuma yerleşiyor.

Yorumlar

Yorum yazmak için giriş yapın.

Yorumlar yükleniyor…

Bugün

Son Dakika

FinansEKSTRA

Bugün

Son Dakika

FinansEKSTRA

Anthropic, Opus 4.5’i tanıttı: Kodlama ve araç kullanımında öne çıkıyor