
Antropic Pazartesi günü Claude 3.5 Sonnet Yapay Zeka (AI) modelinin yükseltilmiş bir versiyonunu yayınladı. Claude 3.7 sonnet olarak adlandırılan tüm Claude kullanıcıları için kullanılabilir. AI firması 3.7 sonnet’i ileri akıl yürütme yeteneğine sahip en akıllı modeli olarak nitelendirdi. Yeni büyük dil modelinin (LLM) ana odağı kodlamadır ve yeteneği desteklemek için şirket, Antropic’in çok çeşitli arka uç kodlama görevlerini yerine getirebilen ilk aracı kodlama aracı olan Claude Code’u tanıttı.
Antropik yeni AI modelini ve ilk AI ajanını yayınladı
Bir haber odasında postalamakşirket, Claude 3.7 sonnet modelinin yayınlandığını duyurdu. Şirket tarafından ilk hibrid AI modelidir ve hem standart bir dil modeli hem de bir akıl yürütme modeli olarak gerçekleştirebilir. Akıl yürütme modelleri genellikle bir sorgu için harcanan süreyi artırmak için test zamanı hesaplama işlevlerini kullanır. Bu süre zarfında, çıktıyı ikinci olarak tahmin eder, alternatif çözümler arar ve bilgileri doğrular.
Claude 3.7 sonnet ile kullanıcılar hem standart hem de akıl yürütme işlevlerini elde etmek için aynı AI modelini kullanabilirler. Hibrit bir model seçmenin ardındaki nedenini açıklayan Antropic, “Akıl yürütmenin tamamen ayrı bir model yerine sınır modellerinin entegre bir yeteneği olması gerektiğine inanıyoruz” dedi.
Gadgets 360 personeli, ücretsiz katmandaki AI modeline erişebildi ve yanıtlar eski sonnet modeline kıyasla daha sofistike görünüyor. Bununla birlikte, iyileştirmeler marjinaldi, bu genellikle çoğu yinelemeli AI modelinde durum böyledir.
Kullanıcılar artık Claude Model Seçici menüsünde yeni bir düşünme moduna erişebilir ve normal ve genişletilmiş arasında seçim yapabilir. Normal mod, başlangıçtaki yanıtlar üretirken, genişletilmiş mod akıl yürütme tabanlı yanıtları tetikleyecektir. Özellikle, genişletilmiş mod şu anda yalnızca profesyonel aboneler için kullanılabilir.
Antropic, uygulama programlama arayüzü (API) aracılığıyla modele erişen geliştiricilerin, modelin bir çıktı üretmeden önce düşündüğü zamanı kontrol edebileceğini söyledi. Bu, Claude için belirli bir belirteç değeri belirlenerek kontrol edilebilir. Bu sayı, bu modelin üst tavanı olan 1.28.000 jetona kadar gidebilir. AI firması, bu granüler kontrolün geliştiricilerin daha odaklanmış ürünler oluşturmasına izin vereceğini vurguladı.
Performansa, Claude 3.7 sonnet, Şirketin dahili testlerine göre SWE-Bench doğrulanmış kıyaslamada yüzde 62,3 puan aldı ve 3.5 sonnet ve Openai’nin O1’inden daha iyi performans gösterdi. Ayrıca, aracı araç kullanımı için Tau Bench ölçütünde O1’den daha iyi performans gösterir.
Ayrıca, AI firması, sınırlı bir araştırma önizlemesinde ilk aracı kodlama aracı olan Claude Code’u da tanıttı. Kod arama ve okuma, dosyaları düzenleme, testler yazma ve çalıştırma, GitHub’a kod taahhüt etme ve itme ve komut satırı araçlarını kullanma gibi çok çeşitli kodlama görevleri gerçekleştirebilir.
Antropik’in iç testinde, aracı aracı, tek bir denemede 45 dakikadan fazla manuel çalışma yapan karmaşık görevleri tamamlayabildi. İlgilenen bireyler önizlemeye erişebilir Burada. AI firması, aracın dahili olarak yaygın olarak kullanıldığını vurguladı.

