Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Yapay zekaya olan güven krizi: OpenAI, Yüksek Lisansların %60 oranında yanlış yanıtlar ürettiğini gösteriyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Yapay zekaya olan güven krizi: OpenAI, Yüksek Lisansların %60 oranında yanlış yanıtlar ürettiğini gösteriyor

Genel

Yapay zekaya olan güven krizi: OpenAI, Yüksek Lisansların %60 oranında yanlış yanıtlar ürettiğini gösteriyor

teknomers
Son güncelleme: 4 Kasım 2024 01:15
teknomers
Paylaş
Paylaş


OpenAI, kendi ve rakip AI modellerinin çıktılarının doğruluğunu değerlendirmek için SimpleQA adı verilen yeni bir kıyaslama başlattı. Ancak test sonuçları, modern büyük dil modelleri (LLM’ler) tarafından oluşturulan bilgilerin güvenilirliğiyle ilgili ciddi sorunları ortaya çıkardı.

Yeni kıyaslamanın amacı, eğitim ve yazılım geliştirmeden sağlık hizmetlerine ve kolluk kuvvetlerine kadar hayatın çeşitli alanlarında giderek daha fazla kullanılan Yüksek Lisans Derecelerinin doğruluğu ve güvenilirliğinin objektif bir değerlendirmesini sağlamaktır. Ancak testler, OpenAI’den o1 ve Anthropic’ten Claude-3.5-sonnet gibi en gelişmiş modellerin bile sırasıyla %42,7 ve %28,9 gibi son derece düşük başarı oranları gösterdiğini gösterdi.


Kaynak: Michael Dwyer/AP

Sorunu daha da karmaşık hale getiren modeller, “yeteneklerini abartma” eğilimi gösteriyor ve “halüsinasyonlar” olarak bilinen tamamen saçma cevaplar üretiyor. Bu eğilim iyi bir şekilde belgelenmiştir ve özellikle sağlık ve kolluk kuvvetleri gibi hassas alanlarda ciddi sonuçlara yol açabilir. Örneğin, hastanelerde kullanılan ve OpenAI teknolojisi üzerine inşa edilen bir yapay zeka modelinin, hastalarla etkileşimleri yazıya geçirirken sık sık halüsinasyonlara ve yanlışlıklara sahip olduğu kaydedildi. ABD’deki polis de yapay zekayı kullanmaya başlıyor, bu da masum olduğuna dair asılsız suçlamalara veya önyargıların artmasına yol açabilir.

Uzmanlara göre SimpleQA testinin sonuçları, mevcut LLM’lerin ne yazık ki güvenilir bir şekilde gerçeği söyleme konusunda yetersiz olduğuna dair bir uyandırma çağrısıdır. Bir OpenAI sözcüsü, “Bu etkinlik, herhangi bir LLM’den gelen herhangi bir çıktının ihtiyatla karşılanması ve oluşturulan metni incelemeye hazır olunması gerektiğini hatırlatmalı” dedi.

AI alanındaki liderlerin iddia ettiği gibi, LLM geçerlilik sorununun daha da büyük eğitim setleriyle çözülüp çözülemeyeceği sorusu hala devam ediyor. Ancak bazı uzmanlara göre, üretilen bilgilerin daha yüksek doğruluğunu ve güvenilirliğini sağlayacak yapay zeka modellerinin geliştirilmesinde yeni yaklaşımların aranması gerekiyor. Bir yapay zeka araştırmacısı, “Yalnızca makul yanıtlar üretebilecek değil, aynı zamanda bunları değerlendirebilecek ve gerçeklikten emin olmadıklarında yanıtları reddedebilecek modeller geliştirmeye odaklanmalıyız” dedi.

SimpleQA kıyaslaması üzerinde yapılan testlerin sonuçları, üretilen bilgilerin güvenilirliğini ve geçerliliğini sağlamak ve yüksek öğrenimin yaşamın çeşitli alanlarında kullanılmasının olası olumsuz sonuçlarını önlemek için yapay zeka alanında daha fazla araştırma ve geliştirmeye duyulan ihtiyacı vurgulamaktadır.



genel-22

Cyberpunk 2077 25 milyon kopya sattı ve The Witcher 3’ten “çok daha hızlı satıyor”
Aussie Telco Telstra, 30.000 Çalışanın Verilerini İfşa Ettiği Bildirildi
Hellblade II, VR’de Oynatılacak veya Siyah Çubukları, Renk Sapmasını, Film Tanesini ve Daha Fazlasını Kaldıracak İlk Modları Aldı
En iyi Roomba Prime Day fırsatları: 200 doların altındaki robotlar süpürür
The Sims 4 My Wedding Stories, LGBTQ + Sansür Endişelerine Rağmen Rusya’da Yayınlanacak
ETİKETLENDİ:antropikGösteriyorGüvenkriziL.L.M.lisanslarınolanOpenAIoranındaürettiğiniyanıtlaryanlışYapayyapay zekaYüksekzekaya
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Hızlı davranın! Apple’ın 9. Nesil iPad’i Kara Cuma öncesinde 200 dolara düştü
Sonraki Makale Amazon’da %40 İndirimle Bu Roomba Robot Elektrikli Süpürge AirPod’lardan Daha Ucuz ve Ömür Boyu Dayanacak

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Apple Fotoğraflar Uygulaması Yeni Yapay Zeka Düzenleme Özellikleriyle Geliyor
Yapay Zeka
Intel yeni oyun destekli iBOT yazılımını 7 oyunla genişletti, %27’ye kadar iyileşme sundu
Donanım
GTA 6’nın Barbenheimer’ı: Barbie Derlemesi Kasım’da Geliyor
Oyun
Restoran Yönetiminde Devrim Yaratacak Kod Güncellemeleri
Oyun
Kritik: NSO Group’un Yeni WhatsApp Phishing Saldırısı ve Yasal Süreçler
Siber Güvenlik
Apple ebeveynlere çocukların iPhone kullanımlarında yeniden kontrol sağlıyor
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?