Yapay zekaya olan güven krizi: OpenAI, Yüksek Lisansların %60 oranında yanlış yanıtlar ürettiğini gösteriyor
OpenAI, kendi ve rakip AI modellerinin çıktılarının doğruluğunu değerlendirmek için SimpleQA adı verilen yeni bir kıyaslama başlattı. Ancak test sonuçları, modern büyük dil modelleri (LLM’ler) tarafından oluşturulan bilgilerin güvenilirliğiyle ilgili…