GenAI doğruluğunu ayırt etmek için OpenAI’nin SimpleQA aracı – doğru mesaj, yanlış haberci – Computerworld

Byteknomers

Kas 13, 2024 #Aracı, #ayırt, #Computerworld, #doğru, #doğruluğunu, #Etmek, #GenAI, #haberci, #için, #Mesaj, #OpenAInin, #SimpleQA, #yanlış

OpenAI raporunda bunu büyük ölçüde kabul ediyor: “Bu çalışmada, yalnızca kısa, gerçekleri arayan soruları tek bir yanıtla ele alarak dil modellerinin açık uçluluğundan kaçınacağız. Kapsamın bu şekilde daraltılması önemlidir, çünkü kısa biçimli olgusallığa ilişkin iyileştirilmiş davranışın uzun biçimli olgusallığa genellenip genellenmeyeceği gibi araştırma sorularını açık bırakma pahasına da olsa, olgusallığın ölçülmesini çok daha kolay takip edilebilir hale getirir.

Raporun ilerleyen kısımlarında OpenAI şöyle açıklıyor: “SimpleQA’nın ana sınırlaması, doğru olmasına rağmen, yalnızca kısa, gerçekleri araştıran sorguların kısıtlı ortamında tek, doğrulanabilir bir yanıtla gerçekliği ölçmesidir. Gerçeklere dayalı kısa yanıtlar verme becerisinin, çok sayıda gerçekle dolu uzun yanıtlar yazma becerisiyle ilişkili olup olmadığı açık bir araştırma sorusu olmaya devam ediyor.”

İşte ayrıntılar: SimpleQA 4.326 “kısa, gerçekleri araştıran sorudan” oluşuyor.

genel-12

By teknomers

Benzer İçerikler

Liste

GenAI doğruluğunu ayırt etmek için OpenAI’nin SimpleQA aracı – doğru mesaj, yanlış haberci – Computerworld

Byteknomers

By teknomers

Benzer İçerikler

Elevation Labs TimeCapsule, AirTag’i on yıl boyunca canlı tutacak

Meta’nın İrlanda Kolu, Veri İhlali Nedeniyle Watchdog Tarafından 264 Milyon Dolar Para Cezasına çarptırıldı

Glen Powell Erotik Gerilim ‘Yuvayıkanlar’ İhale Savaşından Sonra Efsanevi Filmde (Özel)

Diablo 4 ve WoW Sahipleri Sınırlı Bir Süre İçin Ücretsiz 25 Dolarlık Binek Paketi Kazanabilir

Zenless Zone Zero 1.4 tonlarca ücretsiz Polychrome dağıtıyor ve Miyabi’yi çekiyor

Epic Games, Fortnite Turnuvasında Hile Yapan Kişiye Dava Açtı

Bugün NYT Connections — 19 Aralık Perşembe için ipuçlarım ve cevaplarım (oyun #557)

%30 indirimle uygun fiyatlı OnePlus Buds 3, bütçesi kısıtlı olan kullanıcılar için mutlaka sahip olunması gereken bir ürün

Amazon ve Best Buy, Noel’den hemen önce 240 dolarlık nadir Motorola Razr+ (2024) indirimi sunuyor

Apple, iPhone abonelik planını daha piyasaya sürülmeden iptal etmeye karar verdi

Fitbit’in Kardiyo Yükü ve Hedef Yükü artık daha fazla akıllı saate geliyor

NASA, eski verileri ve yeni teknikleri kullanarak ‘yan’ kara delik buluyor

Yılın son meteor yağmuru Noel’den birkaç gün önce zirveye çıkıyor

NASA, uzay istasyonunda mahsur kalan astronotların dönüşünü bir kez daha erteledi

SpaceX, 20 saat içinde 3 roket fırlatmayı ve 1 Dragon inişini hedefliyor

İlginizi Çekebilir

Elevation Labs TimeCapsule, AirTag’i on yıl boyunca canlı tutacak

Tottenham – Man Utd canlı akışı: EFL Kupası maçını çevrimiçi izleyin

Sonic The Hedgehog 3 Harika Rotten Tomatoes Skoru Aldı!

Diablo 4 ve WoW Sahipleri Sınırlı Bir Süre İçin Ücretsiz 25 Dolarlık Binek Paketi Kazanabilir