Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Anthropic’in Claude 2.1 LLM’si, Context Recall’da OpenAI’nin GPT-4’ünden Geride Kaldı
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Anthropic’in Claude 2.1 LLM’si, Context Recall’da OpenAI’nin GPT-4’ünden Geride Kaldı

Genel

Anthropic’in Claude 2.1 LLM’si, Context Recall’da OpenAI’nin GPT-4’ünden Geride Kaldı

teknomers
Son güncelleme: 22 Kasım 2023 18:27
teknomers
Paylaş
Paylaş


Bu bir yatırım tavsiyesi değildir. Yazarın bahsi geçen hisse senetlerinin hiçbirinde pozisyonu bulunmamaktadır. Wccftech.com’un bir bilgilendirme ve etik politikası vardır.

Büyük Dil Modellerinin (LLM’ler) mevcut yinelemelerinin artan bağlam yüklerini kavrama konusundaki sınırlı yeteneği, şu anda yapay zeka tekilliğine – yapay zekanın insan zekasını açıkça aştığı bir eşik – ulaşmanın önündeki en büyük engellerden biri olmaya devam ediyor. İlk bakışta, Anthropic’in Claude 2.1 LLM’sinin 200K token içerik penceresi etkileyici görünüyor. Bununla birlikte, bağlam hatırlama yeterliliği, özellikle OpenAI’nin GPT-4’ünün nispeten güçlü hatırlama yetenekleriyle karşılaştırıldığında, arzu edilenden çok daha fazlasını bırakıyor.

Yeni modelimiz Claude 2.1, sektör lideri 200.000 token bağlam penceresi, halüsinasyon oranlarında 2 kat azalma, sistem istemleri, araç kullanımı ve güncellenmiş fiyatlandırma sunar.

Claude 2.1 Konsolumuzda API üzerinden mevcuttur ve https://t.co/uLbS2JNczH sohbet deneyimi. pic.twitter.com/T1XdQreluH

— Antropik (@AntropikAI) 21 Kasım 2023

Anthropic dün, en son Claude 2.1 LLM’nin artık 200.000 tokenlik “sektör lideri” bir bağlam penceresini desteklediğini ve model halüsinasyonlarında 2 kat azalma sağladığını duyurdu. belirsiz veya çelişkili girdi, yanlış veya anlamsız çıktı sağlama.

Farkında olmayanlar için belirteç, LLM’lerin dili işlemek ve oluşturmak için kullandığı temel bir metin veya kod birimidir. Kullanılan simgeleştirme yöntemine bağlı olarak, simge bir karakter, sözcük, alt sözcük ya da metnin ya da kodun tamamı olabilir. Claude 2.1’in genişletilmiş bağlam penceresi, LLM’nin yaklaşık 470 sayfalık bir kitabı anlamasına ve işlemesine olanak tanır.

Elbette, Anthropic’in Claude 2.1’inin 200K jetonlu bağlam penceresi, yalnızca 128K jetonlu pencereyi destekleyen OpenAI’nin GPT-4’üyle karşılaştırıldığında oldukça etkileyici. Bununla birlikte, bu genişletilmiş bağlam penceresinin gerçek dünyadaki uygulaması, Claude 2.1’in pek de etkileyici olmayan bağlamı hatırlama yeteneği göz önüne alındığında parlaklığının bir kısmını kaybediyor.

Bağlamı Hatırlama: Anthropic’in Claude 2.1 vs. OpenAI’nin GPT-4’ü

Yapay zeka uzmanı Greg Kamradt yakın zamanda, belirli bir modelin değişen geçiş derinliklerine yerleştirilmiş belirli bir gerçeği ne kadar doğru şekilde hatırlattığını belirlemeyi amaçlayan standart bir test aracılığıyla Claude 2.1’i GPT-4 ile karşılaştırdı.

Kamradt özellikle aşağıdaki metni değişen pasaj derinliklerine yerleştirdi:

“San Francisco’da yapılacak en iyi şey bir sandviç yemek ve güneşli bir günde Dolores Park’ta oturmak.”

Araştırmacı giriş metnini 35 eşit parçaya böldü ve ardından yukarıdaki gerçeği bu 35 derinliğin her birine yerleştirdi ve Claude 2.1’den her seferinde ilgili soruyu yanıtlamasını istedi. Araştırmacı ayrıca 1K token’dan 200K token’a kadar değişen ve 35 eşit artışa bölünmüş bağlam penceresini de değiştirdi. Buna git X gönderisi Kullanılan metodoloji hakkında daha fazla bilgi için.

Claude-2.1-Test-Sonuçları

Yukarıda, Anthropic’in Claude 2.1’inin belirli bir belge derinliğinde ve bağlam penceresi uzunluğunda gömülü gerçeği ne kadar doğru şekilde hatırlayabildiğini göreceksiniz. Her kırmızı blok, hatırlama başarısızlığını temsil eder. Yukarıdaki parçadan da anlaşılacağı gibi, LLM’nin geri çağırma yeteneği, bağlam penceresi arttıkça giderek azalır.

GPT-4 Test Sonuçları

Karşılaştırma amacıyla OpenAI’nin GPT-4’üyle gerçekleştirilen benzer bir testin sonuçları yukarıda gösterilmektedir. Burada, gerçeğin yerleştirildiği derinlik ve LLM’nin bağlam penceresi 15 farklı artışla değiştirildi. Buna yönel X gönderisi daha fazla detay için.

GPT-4’ün maksimum bağlam penceresi uzunluğu olan 128.000 jetonda yüzde 100 geri çağırma hatalarının önemli ölçüde daha az olduğunu unutmayın.

Önceki bir gönderide GPT-4’ün uzun süren bir matematik sınavında xAI’nin Grok’unu ve Anthropic’in Claude 2 LLM’sini geride bıraktığını belirtmiştik. Claude 2.1’in aynı ortamda GPT-4’e karşı nasıl performans göstereceğini zaman gösterecek.

Bu hikayeyi paylaş

Facebook

heyecan





genel-17

Microsoft, Windows 11 KB5017383 ile Birkaç Düzeltmeyi Kaldırdı
Apple, iPhone’un bir ödeme terminali olduğunu duyurdu
Yoshida, FFXIV 7.0 hikaye planlama etkinliğinin tamamlandığını söylüyor
Japonya ve Güney Kore, start-up’ları arasında ortaklıklar kurmayı planlıyor – Siècle Digital

MoviePass’ten Hedefe Yönelik Yeni Adım: Mogul ile Sinema Dünyasına Fantastik Bir Dokunuş

ETİKETLENDİ:AnthropicinClaudeContextgerideGPT4ündenkaldıLLMsiOpenAIninRecallda
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Sands of Time Remake “Önemli Bir Dönüm Noktasına” Ulaştı
Sonraki Makale Microsoft Xbox Store artık UPI ödemelerini destekliyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Breville İndirim Kodu: Haziran 2026’da $700 Tasarruf Fırsatı
Genel
32GB DDR5 RAM Artık En Az 375 Dolar – AI Kıtlığı PC İnşaatını Zorluyor
Donanım
HTTP İstekleri için Bir Yalan Dedektörü: Zaman İçinde Analitik – DEV Community
Yazılım
Pura İndirim Kodları: Mayıs 2026’da $20 Tasarruf Edin!
Genel
Donanım Dünyası: Computex 2026, 2. Gün – Röportajlar ve Paneller
Donanım
Benchmark ilk büyüme fonunu 2 milyar dolarlık finansmanla hayata geçiriyor
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?