AI Mücadelesi için en çok performans gösteren meydan okuma devam ediyor ve bu sefer Ace’i oyun tezgahına düşüren antropik. Son günlerde sunulan, ücretsiz olanlar da dahil olmak üzere tüm abonelik planları için zaten mevcut olan en gelişmiş yapay zeka modeli ve “piyasadaki ilk hibrit akıl yürütme modeli” Claude 3.7 sonnet olarak adlandırılır. Geliştiricilere göre, Claude ailesinin ikinci modeli, konuşmaları anlama ve akıl yürütme yeteneğinde önemli bir adımdır, sadece işleme gücünü değil, aynı zamanda analiz derinliğini ve kalitesini de destekleyen bir yaklaşım için ayrılır. etkileşim insan-akkin.
Bu hibrit model, Antropic’in ayrı modellerin aksine, tüm işi yapan tek bir modelle ürünlerinin kullanıcı deneyimini basitleştirmek isteme çabasını temsil eder. Başlangıç’a göre, Claude 3.7 sonnet “piyasadaki diğer akıl yürütme modellerinden farklı bir felsefe” ile geliştirildi. Hem hızlı yanıtlar hem de derin yansıma için tek bir beyni kullanan insanlara atıfta bulunarak, modelin akıl yürütme kapasitesi diğer her şeyle entegre edilmiştir ve ayrılmamıştır. Akıl yürütmenin tamamen ayrı bir modelden ziyade konuşma modellerinin entegre bir kapasitesi olması gerektiğine inanıyoruz “, özellikle Openai O1’in gelişmiş akıl yürütme modeline atıfta bulunarak antropik web sitesini okuyor.
Büyüteç altındaki yeni model
Yeni model iki şekilde etkileşime girebilir: modelin normal olarak yanıt verdiğini veya “Standart modda Claude 3.7 sonnet’in Claude 3.5 sonnet’in güncellenmiş bir versiyonunu temsil ettiğini seçebilirsiniz. Pro kullanıcıları için ayrılmış ve Claude’un ücretsiz versiyonundan erişilemeyen “genişletilmiş akıl yürütme” moduna gelince, sistemin cevapları formüle etmeden önce “daha uzun düşünmesine” izin verir ve bir şekilde insan bilişsel sürecini taklit eder. Ekonomiden bilime, felsefeden gelişmiş programlamaya kadar çok taraflı analiz ve birbirine bağlı hususlar gerektiren karmaşık sorunlarla karşılaşmada özellikle değerli olduğunu kanıtlayan bir işlevsellik. Antropic, “Genel olarak, model için istemin her iki modda da benzer şekilde çalıştığını görüyoruz” diyor.
Antropic, yeni akıl yürütme modelinin geliştirilmesinde, matematik ve bilgisayar bilimlerindeki sorunları biraz daha az optimize ettiklerini, LLM’yi kullanan şirketlere bir göz alarak, gerçek dünyadaki sorunları yansıtan faaliyetlere daha fazla dikkat çektiğini açıkladı. Gerçek dünyadaki kodlama faaliyetlerini ölçmek için bir testte SWE-Bench, Claude 3.7 sonnet,%49.3 elde edilen O3-mini Openai modeline kıyasla%62.3’lük bir doğruluk elde etti. Bir model AI’nın perakende satışta simüle edilmiş kullanıcılar ve dış arılarla etkileşim kurma yeteneğini ölçmek için başka bir testte, Tau-Bench, Claude 3.7 sonnet,%73.5 elde edilen Openai Openai modeline kıyasla%81.2 elde etmiştir.
Ayrıca kodlama cephesinde, model, programlama dillerinin daha derin bir şekilde anlaşılmasını ve yazılım çözümlerinin üretilmesinde daha fazla hassasiyeti, onu hata ayıklama, kodun optimizasyonu veya yeni bir şekilde uygulanması için yardım arayan geliştiriciler için değerli bir araç haline getirir. özellikler.

