Anthropic, Claude Opus 4.8’i Perşembe günü piyasaya sürüyor ve şirket, modelin “dürüstlüğünü” ön plana çıkarıyor.
Anthropic’e göre, tüm modellerini “dürüst” olması için eğitiyor; örneğin, destekleyemeyecekleri iddialardan kaçınmak gibi. Ancak, yapay zeka modellerinin genel bir sorununun, bazen sonuçlara atlamak ve ince kanıtlara rağmen ilerleme kaydetmiş gibi kendine güvenen bir şekilde çalışmaları olduğunu belirtiyor.
Yapay zeka laboratuvarı, erken testerların Opus 4.8’in “yaptığı iş üzerine belirsizlikleri daha fazla belirleme olasılığı olduğunu ve desteklenmeyen iddialarda bulunma olasılığının daha düşük olduğunu” bulduğunu iddia ediyor. Şirketin değerlendirmelerine göre, Opus 4.8, önceki versiyonuna kıyasla yazdığı kodda hataların duraksamasına izin verme olasılığını yaklaşık 4 kat azaltıyor.
Dürüstlük iyileştirmelerinin yanında, Opus 4.8 ile kullanıcılar Claude’un bir göreve ne kadar çaba harcayacağını yönlendirebiliyor. Daha yüksek çaba ile verilen yanıtlar daha fazla token kullanıyor; kullanıcılar, hız limitlerini hızla aşmak istemiyorlarsa daha düşük çaba gerektiren yanıtları seçme seçeneğine sahip.
Anthropic ayrıca, “dinamik iş akışları” adı verilen bir özelliği araştırma önizlemesiyle tanıtıyor. Şirket, bu özellik sayesinde Claude’un “daha büyük görevleri üstlenebileceğini” söylüyor. Dinamik iş akışları ile “Claude, işi planlayabilir ve ardından tek bir oturumda yüzlerce paralel alt ajanı çalıştırabilir (ve Opus 4.8 ile bu ajanlar daha uzun süre çalışabilir). Sonrasında kullanıcıya geri bildirimde bulunmadan önce çıktısını doğruluyor.”
Yeni özellikleriyle birlikte Claude, sizce yapay zeka dünyasında nasıl bir etki yaratabilir?

