Anthropic, orta boy Sonnet modeli için yeni bir versiyonunu tanıttı. Şirket, dört aylık güncelleme döngüsüne sadık kalarak bu yeniliği duyurdu. Yeni modelle birlikte kodlama, talimatları takip etme ve bilgisayar kullanımı konularında önemli geliştirmeler yapıldığı vurgulandı.
Sonnet 4.6’nın Yeni Özellikleri
Sonnet 4.6, ücretsiz ve Pro plan kullanıcıları için varsayılan model olacak.
Yeni Bağlam Penceresi
Sonnet 4.6’nın beta sürümü, 1 milyon token’lık bir bağlam penceresi içerecek. Bu, Sonnet için daha önce sunulan en büyük pencerenin iki katı boyutunda. Anthropic, yeni bağlam penceresini “tam kod tabanlarını, uzun sözleşmeleri veya tek bir istekte onlarca araştırma makalesini tutacak kadar yeterli” olarak tanımlıyor.
Rekor Benchmark Skorları
Yayın, Opus 4.6’nın lansmanından sadece iki hafta sonra gerçekleşti ve güncellenmiş Haiku modelinin de önümüzdeki haftalarda tanıtılması bekleniyor. Yeni modelle birlikte, OS World bilgisayar kullanımında ve SWE-Bench yazılım mühendisliğinde rekor benchmark skorları elde edildi. Ancak belki de en etkileyici veriyi 60.4%’lük ARC-AGI-2 skoru oluşturuyor. Bu skor, insan zekasına özgü becerileri ölçmek için geliştirilmiş. Sonnet 4.6, karşılaştırılabilir modellerin çoğunun üzerinde bir performans sergilemesine rağmen, Opus 4.6, Gemini 3 Deep Think ve bir versiyon geliştirilmiş GPT 5.2 gibi modellere kıyasla geride kalıyor.
Yeni özellikler ve başarılar hakkında sizin düşünceleriniz neler?

