Anthropic, yeni AI sohbet robotu modellerinin OpenAI'nin GPT-4'ünü yendiğini iddia ediyor - Dünyadan Güncel Teknoloji Haberleri

Google ve yüz milyonlarca risk sermayesi tarafından desteklenen yapay zeka girişimi Anthropic (ve belki yakında yüz milyonlarca daha), Bugün duyuruldu GenAI teknolojisinin en son sürümü Claude. Ve şirket, AI chatbot’un performans açısından OpenAI’nin GPT-4’ü olduğunu iddia ediyor.

Anthropic’in yeni GenAI’sı olarak adlandırılan Claude 3, bir model ailesidir – Claude 3 Haiku, Claude 3 Sonnet ve Claude 3 Opus, Opus en güçlüleridir. Hepsi analiz ve tahminde “artan yetenekler” ve Antropik iddiaların yanı sıra ChatGPT ve GPT-4 (ancak GPT-4 Turbo değil) ve Google’ın Gemini 1.0 Ultra (ancak Gemini 1.5 Pro değil) gibi modellere kıyasla belirli kıyaslamalarda gelişmiş performans gösteriyor. .

Özellikle Claude 3, Anthropic’in ilk çok modlu GenAI’sidir; bu, GPT-4 ve Gemini’nin bazı özelliklerine benzer şekilde, görüntülerin yanı sıra metinleri de analiz edebildiği anlamına gelir. Claude 3 fotoğrafları, çizelgeleri, grafikleri ve teknik diyagramları işleyebilir, PDF’lerden, slayt gösterilerinden ve diğer belge türlerinden çizim yapabilir.

Bazı GenAI rakiplerinden bir adım daha iyi olan Claude 3, tek bir istekte birden fazla görüntüyü (maksimum 20’ye kadar) analiz edebilir. Anthropic, bunun görüntüleri karşılaştırmasına ve kontrast oluşturmasına olanak tanıdığını belirtiyor.

Ama Claude 3’ün görüntü işlemesinin sınırları var.

Antropik, modellerin insanları tanımlamasını engelledi; şüphesiz etik ve yasal sonuçlar konusunda ihtiyatlı davrandı. Şirket, Claude 3’ün “düşük kaliteli” görüntülerle (200 pikselin altında) hata yapmaya eğilimli olduğunu ve mekansal akıl yürütme (örn. analog saat kadranını okumak) ve nesne sayımı (Claude 3’ün kesin bilgi veremediği) içeren görevlerde zorluk yaşadığını kabul ediyor. görüntülerdeki nesnelerin sayısı).

Resim Kredisi: Antropik

Claude 3 de olmayacak oluşturmak sanat eseri. Modeller en azından şimdilik kesinlikle görüntü analizi yapıyor.

Anthropic, müşterilerin genellikle Claude 3’ten çok adımlı talimatları daha iyi takip etmesini, aşağıdaki gibi formatlarda yapılandırılmış çıktılar üretmesini bekleyebileceğini söylüyor. JSON ve öncekilerle karşılaştırıldığında İngilizce dışındaki dillerde sohbet edin. Anthropic, Claude 3’ün “taleplerin daha incelikli bir şekilde anlaşılması” sayesinde soruları daha az yanıtlamayı da reddetmesi gerektiğini söylüyor. Ve yakında modeller, kullanıcıların yanıtlarını doğrulayabilmeleri için sorulara verdikleri yanıtların kaynağını belirtecek.

Anthropic bir destek makalesinde “Claude 3 daha etkileyici ve ilgi çekici yanıtlar üretme eğiliminde” diye yazıyor. “[It’s] Eski modellerimize kıyasla yönlendirmek ve yönlendirmek daha kolaydır. Kullanıcılar, daha kısa ve daha kısa yönlendirmelerle istenen sonuçlara ulaşabileceklerini görmeli.”

Bu iyileştirmelerden bazıları Claude 3’ün genişletilmiş bağlamından kaynaklanmaktadır.

Bir modelin bağlamı veya bağlam penceresi, modelin çıktıyı üretmeden önce dikkate aldığı girdi verilerini (örneğin metin) ifade eder. Küçük bağlam pencerelerine sahip modeller, en yeni konuşmaların içeriğini bile “unutmaya” eğilimlidir ve bu da onların konudan sapmasına yol açar – çoğu zaman sorunlu yollardan. Ek bir avantaj olarak, geniş bağlamlı modeller aldıkları verilerin anlatı akışını daha iyi kavrayabilir ve bağlamsal olarak daha zengin yanıtlar üretebilir (en azından varsayımsal olarak).

Anthropic, Claude 3’ün başlangıçta yaklaşık 150.000 kelimeye eşdeğer 200.000 jetonluk bir bağlam penceresini destekleyeceğini ve seçilmiş müşterilerin 1 milyon jetonluk bir bağlam penceresi (~ 700.000 kelime) açacağını söylüyor. Bu, Google’ın en yeni GenAI modeli olan ve aynı zamanda bir milyona kadar jeton bağlam penceresi sunan, yukarıda bahsedilen Gemini 1.5 Pro ile aynı seviyededir.

Şimdi, Claude 3’ün daha önce gelenlere göre bir yükseltme olması onun mükemmel olduğu anlamına gelmiyor.

Teknik olarak Beyaz kağıtAnthropic, Claude 3’ün diğer GenAI modellerini rahatsız eden önyargı ve halüsinasyonlar (yani uydurmalar) gibi sorunlardan muaf olmadığını kabul ediyor. Bazı GenAI modellerinin aksine Claude 3 web’de arama yapamaz; modeller yalnızca Ağustos 2023 öncesine ait verileri kullanarak soruları yanıtlayabiliyor. Ayrıca Claude çok dilli olmasına rağmen bazı “düşük kaynaklı” dillerde İngilizce kadar akıcı değil.

Ancak Anthropic önümüzdeki aylarda Claude 3’e sık sık güncelleme sözü veriyor.

“Model zekasının sınırlarına yakın olduğuna inanmıyoruz ve [enhancements] önümüzdeki birkaç ay içinde Claude 3 model ailesine katılacak.” Blog yazısı.

Opus ve Sonnet artık web üzerinden ve Anthropic’in geliştirme konsolu ve API’si, Amazon’un Bedrock platformu ve Google’ın Vertex AI’sı aracılığıyla mevcut. Haiku bu yılın sonlarında onu takip edecek.

İşte fiyatlandırma dökümü:

Opus: Bir milyon giriş jetonu başına 15 ABD doları, bir milyon çıkış jetonu başına 75 ABD doları
Sonnet: Bir milyon giriş jetonu başına 3 ABD Doları, bir milyon çıkış jetonu başına 15 ABD Doları
Haiku: Bir milyon giriş jetonu başına 0,25 ABD doları, bir milyon çıkış jetonu başına 1,25 ABD doları

İşte bu Claude 3. Peki tüm bunların 30.000 feetlik görüntüsü nedir?

Peki, bizim yaptığımız gibi rapor edildi Daha önce Anthropic’in amacı “Yapay zekanın kendi kendine öğretmesi” için yeni nesil bir algoritma yaratmaktı. Böyle bir algoritma, e-postalara cevap verebilen, araştırma yapabilen, sanat eseri, kitap ve daha fazlasını üretebilen sanal asistanlar oluşturmak için kullanılabilir; bunlardan bazılarını zaten aşağıdakiler aracılığıyla deneyimledik: GPT-4 ve diğer büyük dil modelleri.

Anthropic, yukarıda bahsedilen blog yazısında buna dair ipuçları veriyor ve Claude 3’e, Claude’un diğer sistemlerle etkileşime girmesine, “etkileşimli olarak” kodlama yapmasına ve “gelişmiş ajan yetenekleri” sunmasına olanak tanıyarak kapı dışı yeteneklerini geliştiren özellikler eklemeyi planladığını söylüyor. .”

Bu son kısım OpenAI’yi akla getiriyor rapor edildi Verileri bir belgeden elektronik tabloya aktarmak veya gider raporlarını otomatik olarak doldurmak ve bunları muhasebe yazılımına girmek gibi karmaşık görevleri otomatikleştirmek için bir yazılım aracısı oluşturma tutkusu. OpenAI halihazırda geliştiricilerin uygulamalarına “aracı benzeri deneyimler” oluşturmalarına olanak tanıyan bir API sunuyor ve görünen o ki Anthropic, karşılaştırılabilir işlevsellik sunma niyetinde.

Bundan sonra Anthropic’ten bir görüntü üreteci görebilir miyiz? Açıkçası beni şaşırttı. Görüntü oluşturucular bugünlerde, esas olarak telif hakkı ve önyargıyla ilgili nedenlerden dolayı pek çok tartışmanın konusu. Google yakın zamanda tarihsel bağlamı gülünç bir şekilde göz ardı ederek resimlere çeşitlilik kattıktan sonra resim oluşturucuyu devre dışı bırakmak zorunda kaldı. Ve bir dizi görüntü oluşturucu satıcısı, kendilerini GenAI’yi tazminat veya hatta kredi bile vermeden bu iş üzerinde eğiterek işlerinden kâr elde etmekle suçlayan sanatçılarla hukuki mücadele içinde.

Anthropic’in GenAI’yi eğitme tekniği olan “anayasal yapay zeka”nın evrimini görmeyi merak ediyorum; şirket, GenAI’nin davranışlarının anlaşılmasını daha kolay, daha öngörülebilir ve gerektiğinde ayarlanmasını daha kolay hale getirdiğini iddia ediyor. Anayasal yapay zeka, bir yol sunmayı amaçlıyor Yapay zekayı insan niyetleriyle uyumlu hale getirinmodellerin sorulara yanıt vermesini ve görevleri basit bir dizi yol gösterici ilkeyi kullanarak yerine getirmesini sağlamak. Örneğin, Claude 3 için Anthropic, modellerin engelli kişiler için anlaşılır ve erişilebilir olmasını sağlayan kitle kaynaklı geri bildirimlerle bilgilendirilmiş bir ilke eklediğini söyledi.

Anthropic’in son oyunu ne olursa olsun, uzun vadede bu işin içinde. Geçen yılın mayıs ayında sızdırılan bir sunuma göre şirket önümüzdeki 12 ay içinde 5 milyar dolar kadar fon toplamayı hedefliyor; bu da OpenAI ile rekabet edebilmek için ihtiyaç duyduğu temel olabilir. (Ne de olsa eğitim modelleri ucuz değil.) Google ve Amazon’un sırasıyla 2 milyar dolar ve 4 milyar dolarlık taahhütlü sermayesi ve taahhütleri ve diğer destekçilerden gelen bir milyarın çok üzerinde miktarıyla yolunda gidiyor.

genel-24

Anthropic, yeni AI sohbet robotu modellerinin OpenAI’nin GPT-4’ünü yendiğini iddia ediyor

Byteknomers

By teknomers

Benzer İçerikler

Apple: Yeni iPad Pro’nun olması gerekiyor "piyasadaki en iyi OLED panel" almak

Vivo X100 Ultra, Vivo X100s, Vivo X100s Pro Lansman Seti 13 Mayıs; Fiyat, RAM ve Depolama Yapılandırmaları İpucu

Rare Magic: The Gathering kartı 3 milyon dolarlık satışla rekor kırdı

Bu video yarışmasında gerçek boyutlu bir Elden Ring heykeli kazanın

Bu Kompakt ve Şık Mekanik Klavye Şu Anda Sadece 25 Dolar

Helldivers 2 Durumu İlk etapta önlenebilirdi

Yeni başlatılan anime tarzı RPG deste oluşturucu Steam’de %90 puan aldı

Moto G Stylus 5G (2024) sızıntısının resmi görselleri

OnePlus 12, daha da makul bir fiyata mega performans sunuyor

Code, Apple’ın yarın Apple Pencil Pro’yu tanıtacağını ortaya koyuyor

Lenovo’nun eğlence kralı Tab P11 Pro (2. Nesil) ile ilgili kapı çalma teklifi artık daha da kaçırılmaz hale geldi

Yeni kara delik görselleştirmesi izleyicileri eşiğin ötesine taşıyor

Yeni “Uzay Kardan Adam” Keşfi Güneş Sistemi Teorilerini Sarsıyor

Çalışma yakındaki bir M-cüce ikili sistemini araştırıyor

Hubble Bir Süpernova Fabrikasını Keşfediyor

İlginizi Çekebilir

Hades 2’de Gümüş madenciliği nasıl yapılır

Apple: Yeni iPad Pro’nun olması gerekiyor "piyasadaki en iyi OLED panel" almak

Son on yılın en iyi FPS oyunlarından birini 5 dolardan daha düşük bir fiyata edinin

Fusion Propulsion’da Yenilik: Rocket Star Inc., SpaceX ile Yeni Tahrik Sistemini Test Ediyor