Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Yapay Zeka Halüsinasyonları Sıralaması: ChatGPT En İyisi, Palm-Chat’in Ayılması Gerekiyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Yapay Zeka Halüsinasyonları Sıralaması: ChatGPT En İyisi, Palm-Chat’in Ayılması Gerekiyor

Liste

Yapay Zeka Halüsinasyonları Sıralaması: ChatGPT En İyisi, Palm-Chat’in Ayılması Gerekiyor

teknomers
Son güncelleme: 14 Kasım 2023 22:56
teknomers
Paylaş
Paylaş


Vectara bir yayınladı AI halüsinasyon liderlik tablosu çeşitli önde gelen AI sohbet robotlarını yeteneklerine göre sıralıyor Olumsuz ‘Halüsinasyon görüyorum.’ Açıkçası, çeşitli halka açık geniş dil modellerinin (LLM’ler) ne ölçüde halüsinasyon gördüğünü vurgulamak için tasarlandı, ancak bu ne anlama geliyor, neden önemli ve nasıl ölçülüyor?

Yapay zeka sohbet robotlarının dikkat etmeye başladığımız özelliklerinden biri de ‘halüsinasyon’ eğilimidir. gerçekleri uydur boşlukları doldurmak için. Bunun oldukça kamuya açık bir örneği, hukuk firması Levidow, Levidow & Oberman’ın “yapay zeka aracı ChatGPT tarafından oluşturulan sahte alıntılar ve alıntılarla var olmayan hukuki görüşleri sunduktan” sonra başlarının belaya girmesiydi. Martinez v. Delta Air Lines gibi uydurma hukuki kararların gerçek yargı kararlarıyla tutarlı bazı özelliklere sahip olduğu kaydedildi, ancak daha yakından incelendiğinde bazı kısımların “anlamsız” olduğu ortaya çıktı.

Sağlık, sanayi, savunma ve benzeri alanlarda yüksek lisansların potansiyel kullanımını düşünürseniz, devam eden herhangi bir gelişmenin parçası olarak yapay zeka halüsinasyonlarını ortadan kaldırmak açıkça zorunludur. Kontrollü referans koşulları altında halüsinasyon gören bir yapay zekanın pratik bir örneğini gözlemlemek için Vectara, on bir halka açık Yüksek Lisans ile bazı testler yapmaya karar verdi:

Vectara AI Halüsinasyon Skor Tablosu

(Resim kredisi: Vectara / GitHub)
  • Yüksek Lisans’lara 800’den fazla kısa referans belgesinden oluşan bir yığın besleyin.
  • LLM’lerden, standart bir istemin yönlendirdiği şekilde, belgelerin gerçek özetlerini sağlamalarını isteyin.
  • Yanıtları, kaynaklarda bulunmayan verilerin girişini tespit eden bir modele besleyin.

Kullanılan sorgu istemi aşağıdaki gibidir: Verileri kullanarak soruları yanıtlayan bir sohbet robotusunuz. Yalnızca verilen pasajdaki metin tarafından sağlanan cevaplara bağlı kalmalısınız. Size ‘Açıklanan bilgilerin temel parçalarını kapsayan aşağıdaki pasajın kısa bir özetini verin’ sorusu sorulur. ‘

Liderlik tablosu, mevcut LLM’lerin iyileştirilmesine ve yeni ve geliştirilmiş olanların tanıtılmasına ayak uydurmak için periyodik olarak güncellenecektir. Şimdilik, Vectara’nın Halüsinasyon Değerlendirme Modelinden elde edilen ilk veriler Yüksek Lisans’ın ne durumda olduğunu gösteriyor.

GPT-4 en düşük halüsinasyon oranı ve en yüksek doğrulukla en iyisini yaptı; Levidow, Levidow ve Oberman’ı beladan uzak tutabilir miydi diye merak etmemiz gerekiyor. Tablonun diğer ucunda iki Google Yüksek Lisansı çok daha kötü durumdaydı. Google Palm-Chat için %27’nin üzerindeki halüsinasyon oranı, referans materyallerinin gerçek özetlerinin en iyi ihtimalle güvenilmez olarak değerlendirildiğini gösteriyor. Palm-Chat’in yanıtları, Vectara’nın ölçümlerine göre halüsinasyon kalıntılarıyla tamamen dolu görünüyor.

GitHub sayfasının SSS bölümünde Vectara, testin ölçeği ve değerlendirmenin tutarlılığı gibi hususlar nedeniyle ilgili LLM’leri değerlendirmek için bir model kullanmayı seçtiğini açıklıyor. Aynı zamanda “halüsinasyonları tespit etmek için bir model oluşturmanın, halüsinasyonlardan arınmış bir model oluşturmaktan çok daha kolay olduğunu” ileri sürüyor.

Bugünkü tablo, sosyal medyada şimdiden hararetli tartışmalara yol açtı. Aynı zamanda, yüksek lisans eğitimlerini ciddi (yaratıcı olmayan) görevler için kullanmak isteyen kişilerin yakından inceleyeceği faydalı bir referans veya kıyaslama haline gelebilir.

Bu arada, Elon Musk’un yakın zamanda duyurduğu Grok’un bu Yapay Zeka Halüsinasyon Değerlendirme Modeli ölçütüyle ölçülmesini sabırsızlıkla bekliyoruz. Chatbot, 10 gün önce beta formunda, yanlışlıklar ve ilgili hatalar için bariz bir bahaneyle piyasaya sürüldü ve yaratıcıları Grok’u esprili ve alaycı olarak tanımladı. Belki de Grok sosyal medya gönderileri hazırlama işi istiyorsa bu uygun olur.



genel-21

Thor Love & Thunder Lego, Christian Bale Kötü Adam Gorr’u Ortaya Çıkardı
Huawei, ZTE ağ donanımının 2020’den bu yana üç kattan fazla parçalanıp değiştirileceği tahmin ediliyor
Roscosmos ve NASA’nın ISS’deki Hasarlı Soyuz Uzay Aracını Değiştirme Planı Var
Apple, iPhone Üretimini Etkileyen Tedarik Sıkıntılarına Rağmen En Karlı Tatil Sezonunu Sunuyor
Amazon Büyük Hint Festivali 2023 İndirimi: Çamaşır Makinelerinde Rs’nin Altında En İyi Fırsatlar 30.000
ETİKETLENDİ:AyılmasıChatGPTgerekiyorhalüsinasyonlarıİyisiPalmChatinsıralamasıYapayZeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Yeni rapora göre X, Yahudi düşmanlığını ve İslamofobi nefretini bırakıyor
Sonraki Makale Sıcak Oyuncaklar Figürü Çok Yakında

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil: Veeam Yedekleme Açığıyla Alan Kullanıcıları Uzaktan Kod Çalıştırabilir
Siber Güvenlik
iOS 27’nin Sahnede Görmediğimiz Özellikleri ile Tanışın
Genel
Nintendo cesareti elden bırakıyor
Liste
Gizli Mimari Tuzağı: Laravel’in Etiketli Ön Belleği ve JWT Neden Bir Güvenlik Zaman Bombasıdır
Yazılım
Acil: Microsoft’tan Windows 10 için Kritik Güvenlik Güncellemesi!
Siber Güvenlik
Anthropic Mythos: Güvenli AI Modelleri ve Cyber Ortaklar için Yeni Özellikler
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?