Bilmeniz gerekenler
- Anthropic yakın zamanda Claude 3.5 Sonnet’in yükseltilmiş bir versiyonunun yanı sıra gelişmiş kodlama yetenekleri ve daha fazlasına sahip Claude 3.5 Haiku adlı yeni bir modeli de piyasaya sürdü.
- Yapay zeka firması ayrıca, kullanıcıların Claude’u bilgisayarları insanlar gibi kullanmaya teşvik etmesine olanak tanıyan yeni bir yetenek olan bilgisayar kullanımını da tanıttı.
- Şirket, bu yeteneğin halka sunulmasının büyük riskler taşıdığını kabul ediyor, ancak bu yolu insanların bu araçtan nasıl yararlandığını gözlemlemek için kullanmayı planlıyor. Eğitim sırasında internete erişimin kısıtlanması gibi kötüye kullanımı önlemek için ayrıntılı önlemler bulunmaktadır.
Üretken yapay zeka ortamı, görünüşe göre yapay zeka tarafından oluşturulan görsellerin ve metinlerin ötesinde bir sonraki aşamaya geçiyor. Anthropic yakın zamanda Claude 3.5 Sonnet’in yükseltilmiş bir versiyonunu ve Claude 3.5 Haiku adlı yeni bir modeli tanıttı. Şirkete göre yükseltilmiş sürüm, gelişmiş kodlama yetenekleriyle birlikte geliyor ve Anthropic’in Claude 3 Opus LLM’si ile aynı performans özelliklerini paylaşıyor.
Daha da ilginci, “Bilgisayar Kullanımı” adı verilen yeni yetenekaçık beta sürümünde mevcuttur. Geliştiriciler, API aracılığıyla “Claude’u bilgisayarları insanların kullandığı şekilde kullanmaya yönlendirebilir; ekrana bakarak, imleci hareket ettirerek, düğmelere tıklayarak ve metin yazarak.” Bu, Claude 3.5 Sonnet’i genel beta sürümünde bilgisayar kullanımı sağlayan ilk yapay zeka modeli haline getiriyor.
Anthropic, kullanıcıların modelle etkileşimde bulunurken hatalar ve pek de kusursuz olmayan bir kullanıcı deneyimi de dahil olmak üzere çeşitli aksiliklerle karşılaşabileceğini kabul ediyor. Şirket, modelin performansını ve verimliliğini artırmak ve iyileştirmek için geri bildirimlerden yararlanmayı umuyor.
Asana, Canva, Cognition, DoorDash, Replit ve The Tarayıcı Şirketi gibi şirketler, genellikle düzinelerce adım gerektiren süreçleri basitleştirmek için bu gruba katıldı. Örneğin, “Replit, Replit Agent ürünü için geliştirilmekte olan uygulamaları değerlendiren önemli bir özellik geliştirmek amacıyla Claude 3.5 Sonnet’in bilgisayar kullanımı ve kullanıcı arayüzü navigasyonu ile ilgili yeteneklerini kullanıyor.”
Claude 3.5 Sonnet’in yükseltilmiş sürümü Anthropic API, Amazon Bedrock ve Google Cloud’un Vertex AI’sında mevcuttur. Anthropic’in Claude 3.5 Haiku’yu bu ayın sonlarında piyasaya sürmesi bekleniyor.
Paylaşılan kıyaslamalara göre Anthropic’in güncellenmiş Claude 3.5 Sonnet’i, özellikle kodlamada önemli bir performans artışı gösteriyor. Örneğin, aracın performansı SWE tezgahı Doğrulandı %33,4’ten %49,0’a yükseldi; bu, önceki modelle aynı fiyatı ve hızı korurken OpenAI Strawberry akıl yürütme yapay zeka modelleri de dahil olmak üzere halka açık modellerden önemli ölçüde daha iyi performans gösterdiğini gösteriyor.
İlgili: NVIDIA CEO’su, yapay zekanın yaygınlaşmasıyla birlikte kodlamanın sona erebileceğini iddia ediyor
Model, bir sorunla karşılaştığını “fark ettiğinde” bir görevde başka bir girişimde bulunarak hatalarını düzeltir ve onu istenen çıktıdan uzaklaştırır. Bildiğiniz gibi, OpenAI o1 ve o1-mini kodlamada son derece mükemmeldir ve OpenAI’nin kodlama için araştırma mühendisi işe alım görüşmesini %90-100 oranında geçmiştir.
Yapay zeka ajanları burada ancak dikkatli ilerleyin
Vurgulanan iyileştirmeler etkileyici olsa da, güncellenen Claude 3.5 Sonnet AI modeli, uçuş rezervasyonlarını değiştirme konusundaki yeterliliğini belirlemek için tasarlanan bir değerlendirmede verilen görevlerin yarısından azını tamamladı. Model, geri dönüşü başlatmaya çalışırken yaklaşık üçte birinde başarısız oldu.
Devamını oku: Salesforce yapay zeka alanında Microsoft’u yenebileceğini söylüyor
Anthropic, modelin yakınlaştırma ve kaydırma ile ilgili zorluklarını vurgulayarak, ekran görüntülerini işleme biçimi nedeniyle açılır bildirimlerin kaçırılmasını kolaylaştırıyor. Şirket, “Claude’un Bilgisayar Kullanımı yavaş ve sıklıkla hataya açık olmaya devam ediyor” diye ekledi.
Şirket, modelin halka açıklanmasının önemli riskler taşıdığını kabul ediyor ancak aynı zamanda modelin nasıl kullanıldığını gözlemlemenin faydalarının tehlikelerden daha ağır bastığını da belirtiyor.
Anthropic’e göre:
“Günümüzün daha sınırlı, nispeten daha güvenli modellerine bilgisayar erişimi vermenin çok daha iyi olduğunu düşünüyoruz. Bu, bu daha düşük düzeyde ortaya çıkan olası sorunları gözlemlemeye ve bunlardan ders almaya başlayabileceğimiz, bilgisayar kullanımını ve güvenlik önlemlerini kademeli ve eş zamanlı olarak geliştirebileceğimiz anlamına geliyor “
Kötü amaçlı kullanımın ve kötü aktörlerin, aracın gelişmiş yeteneklerinden yararlanarak zarar vermesini önlemek amacıyla, yeni Claude 3.5 Sonnet, kullanıcıların ekran görüntüleri ve istemleri konusunda eğitilmemiştir. Eğitim sırasında internete erişim de kısıtlanmıştır. Anthropic, modeli sınıflandırıcılarla geliştirdi ve modeli hesap oluşturma ve sosyal medyada paylaşım yapma gibi yüksek riskli eylemlerden uzaklaştırdı.