Üretken yapay zeka arasındaki rekabette, Gemini ile Google ve GPT ile OpenAi gibi olağan şüphelilere ek olarak üçüncü bir çark daha var: Buna Anthropic adı veriliyor ve Claude, en son sürümüyle doğrudan rakiplerine meydan okuyan chabot. Amazon tarafından satın alınan ve kurucular Dario ve Daniela Amodei tarafından yönetilen start-up tarafından duyurulan chatbot’un üç versiyonu bulunuyor: Yalnızca “Pro” ücretli erişimle kullanılabilen daha güçlü Llm’ye sahip Opus ve onun küçük kardeşleri Sonnet ve Haiku.
“İstihbaratta yeni bir standart” duyurusu
Geliştiricilere göre profesyonel sürüm, “Karmaşık görevlerde insana yakın düzeyde anlayış ve akıcılık” sergiliyor ve çok çeşitli bilişsel görevlerde çıtayı yükseltmeyi vaat ederek, yapay zeka sistemlerini değerlendirmek için kullanılan değerlendirme kriterlerinin çoğunda akranlarından daha iyi performans göstermeyi vaat ediyor. lisansüstü düzeyde uzman bilgisi (Mmlu), lisansüstü düzeyde uzman muhakemesi (Gpqa) ve temel matematik (Gsm8k). Özellikle üçlünün en iyi performans gösteren modeli olan Opus, “Şu anda mevcut olan diğer tüm modellerden daha üstün bir zeka” olarak sunuluyor ve programlama arayüzleri (API’ler), etkileşimli kodlama ve veritabanları üzerinde karmaşık eylemleri planlamak ve yürütmek için kullanılabilir. Stratejik düzeyde ayrıca araştırma incelemeleri yapabilir, beyin fırtınası yapabilir ve hipotezler üretebilir. Ayrıca, diyagramlar ve grafikler de dahil olmak üzere finansal verilerin gelişmiş analizi, piyasa eğilimlerinin oluşturulması ve gelecek senaryolarına ilişkin tahminler sayesinde çok sayıda sayıyla çalışanları da memnun edecektir. Bütün bunlara uyuşturucuların keşfi de eklendi.
Claude’un tüm yükseltmeleri: hızdan israfa ve güvenliğe
Önceki nesillerle karşılaştırıldığında, chatbotun üçüncü versiyonunun iyileştirmeleri önemli. Sunumda Anthropic, daha az sıklıkta hatayla, karmaşık ve gerçek soruları daha iyi anlama ve yanıtlama becerisiyle daha fazla doğruluk elde ettiğini, isteklerin göz ardı edilebilir bir reddedilme ve reddedilme oranına ulaştığını vurguladı. Antropik ekibin yürüttüğü çalışma, taleplere verilen yanıtları üç kategoriye ayırmayı içeriyordu: doğru, yanlış (veya halüsinasyonlar) ve sözde “belirsizliğin kabulü”. İkinci durumda Claude, yanlış bilgi vermekten kaçınarak cevabı bilmediğini iddia ediyor. Ayrıca, İtalyanca da dahil olmak üzere İngilizce dışındaki dillerde daha fazla akıcılık sağlandı.Önyargıları ve güvenliği de ilgilendiren iyileştirme çalışmaları yapıldı. Kurucu ortaklara göre Claude 3, önceki modellere göre daha az önyargıya sahip ve Beyaz Saray ve 2023 ABD Yönetici Kararnamesi ile yapılan taahhütler doğrultusunda AI güvenlik seviyesi 2’yi (ASL-2) sağlıyor. Araştırmacıların güvenlik seviyesini 3’e yükseltme niyetinde olduğu şu anda “göz ardı edilebilir bir felaket riski potansiyeli” söz konusu.
Opus’un Ötesinde: Sonnetler ve Haiku
Sonnet, zeka ve hız arasında ideal dengeyi yakalayabilen, rakiplerine göre daha düşük maliyetle yüksek performans sunan chatbot olarak sunuluyor. İş bağlamında ürün tavsiyesi, pazar tahminleri ve hedefe yönelik pazarlama için kullanılabilir. Daha az performans gösteren sürüm olan Haiku, müşterilerle etkileşimi geliştirmek isteyen (canlı etkileşimlerde ve çevirilerde hızlı ve doğru destek) ve içerik denetlemede, riskli davranışları veya müşteri isteklerini tespit etmek isteyen şirketler ve tüm bu maliyetler için mükemmeldir. tasarruf faaliyetleri (optimize edilmiş lojistik, envanter yönetimi ve yapılandırılmamış verilerden bilgi çıkarma).
Model kullanılabilirliği
Opus, Claude Pro aboneleri için Anthropic’in API’si ile kullanıma hazır durumdayken, Sonnet, Claude.ai ve Amazon Bedrock aracılığıyla ücretsiz olarak edinilebilir. Haiku için çıkış tarihi henüz açıklanmadığı için biraz daha beklememiz gerekecek.