Yapay zeka şirketi Anthropic, birçok kıyaslamada Google’ın Gemini ve OpenAI’nin ChatGPT’sinden daha iyi performans gösterebileceğini iddia ettiği yeni Claude 3 model “ailesinin” ön izlemesini yapıyor.
Bu grup üç yapay zekadan oluşur değişen derecelerde “yetenek” ile. En altta Claude 3 Haiku var, ardından Claude 3 Sonnet geliyor ve en üstte Claude 3 Opus var. Anthropic, üçlünün çok modlu olmaları, gelişmiş doğruluk düzeyleri, bağlamı daha iyi anlamaları ve hızları nedeniyle her alanda “güçlü performans” sunduğunu iddia ediyor. Üçlüyle ilgili dikkate değer olan şey de zor soruları yanıtlamaya daha istekli olmaları.
Anthropic, Claude’un eski versiyonlarının bazen güvenlik korkuluklarının sınırlarını zorlayan komutlara yanıt vermeyi reddettiğini açıklıyor. Artık Claude 3 ailesi, bu zor soruları yanıtlamalarına olanak tanıyan yanıtlarıyla daha incelikli bir yaklaşıma sahip olacak.
Her yönüyle performans artışına rağmen, duyuruların çoğu Opus’un tüm bu alanlarda en iyisi olduğuna odaklanıyor. Modelin “insana yakın kavrama düzeyi sergilediğini” söyleyecek kadar ileri gidiyorlar. [for] karmaşık görevler”.
Uzmanlaşmış yapay zekalar
Bunu test etmek için Anthropic, Opus’u “Samanlıktaki İğne” veya NIAH değerlendirmesinden geçirerek verileri ne kadar iyi hatırlayabildiğini gördü. Görünüşe göre yapay zeka bilgiyi neredeyse mükemmel ayrıntılarla hatırlayabildiği için bu oldukça iyi. Şirket, Opus’un matematik problemlerini çözebilen, bilgisayar kodu oluşturabilen ve GPT-4’ten daha iyi mantık yürütebilen oldukça akıllı bir çerez olduğunu iddia ediyor.
Teknolojinin tuhaflıkları yok değil. Anthropic, yapay zekalarının doğruluğunun arttığını belirtse de halüsinasyon sorunu hala mevcut. Modellerin ortaya çıkardığı yanıtlar, Claude 2.1’e kıyasla büyük ölçüde azaltılmış olmasına rağmen yanlış bilgiler içerebilir. Ayrıca Opus, bir soruyu Claude 2 ile karşılaştırılabilir hızlarda yanıtlama konusunda biraz yavaştır.
Elbette bu Haiku veya Sonnet’in Opus’tan daha az olduğu anlamına gelmiyor çünkü belirli kullanım durumları var. Örneğin Haiku, hızlı yanıtlar verme ve “yapılandırılmamış verilerden” bilgi alma konusunda harikadır. Ayrıca matematik sorularını yanıtlamada Opus kadar iyi değil. Sonnet, insanların sıradan görevlerde zamandan tasarruf etmelerine ve hatta “görüntülerdeki metin” satırlarını ayrıştırmalarına yardımcı olmayı amaçlayan daha büyük ölçekli bir modeldir; Opus ise büyük ölçekli işlemler için idealdir.
İnterneti değiştirme
Hem Sonnet hem de Opus şu anda satın alınabilir, ancak Şirketin web sitesinde Claude’un ücretsiz sürümü. Haiku için bir çıkış tarihi verilmedi ancak Anthropic, yakında yayınlanacağını belirtiyor.
Muhtemelen tahmin edebileceğiniz gibi, Claude 3 üçlüsü daha çok belirli iş yüklerini otomatikleştirmek isteyen işletmelere yöneliktir. Grupla olan deneyiminiz muhtemelen çevrimiçi bir sohbet robotu şeklinde gelecektir. Amazon kısa süre önce uygulamaya geçeceğini duyurdu Anthropic’in AWS’deki yeni yapay zekaları (Amazon Web Services), platformdaki web sitelerine, markaların ve müşterilerinin ihtiyaçlarına uyacak özelleştirilmiş bir Claude 3 modeli oluşturmanın bir yolunu sunuyor.
Günlük kullanıma uygun bir model arıyorsanız TechRadar’ın 2024 için en iyi yapay zeka içerik oluşturucuları listesine göz atın.