AI Halüsinasyonlar: Yeni Openai GPT-4.5 modeli, cevapların% 37’sinde yanılıyor

Son güncelleme: 2 Mart 2025 22:40

Openai şirketi, yeni dil modeli GPT-4.5’in, Simpleqa’nın gerçekliğini değerlendirmek için iç araca göre vakaların% 37’sinde yanlış cevaplar ürettiğini doğruladı. Resmi sürümde dile getirilen bu veriler, modern AI algoritmalarının güvenilirliği hakkında bir tartışmaya neden oldu.

İlerleme ifadelerine rağmen-GPT-4O ve O3-Mini’nin önceki sürümleri sırasıyla halüsinasyonların% 61.8 ve% 80.3’ü gösterdi-Experts, “en iyi modellerin” bile yanlış kaldığını vurgulamaktadır.

Fotoğraf: David Paul Morris / Bloomberg

Cornell Üniversitesi’nden AI Halüsinasyonlarının CO’su Vening Zhao, “Şimdi en gelişmiş sistemler bile vakaların sadece% 35’inde kurgu olmadan metin üretebiliyor” dedi. Yorumu endüstrinin sistemik sorununu doğrulamaktadır: “insansı zeka” ile araç olarak konumlandırılan pahalı modeller genellikle temel gerçeklerle karıştırılmaktadır.

Yüz milyarlarca dolar olarak tahmin edilen Openai, geçmiş sürümlere kıyasla hatalarda bir azalmaya odaklanarak reaksiyonu yumuşatmaya çalışıyor. Bununla birlikte, eleştirmenler bu tür karşılaştırmaların sadece teknolojinin gelişiminde durgunluğu maskelediğini belirtiyor. ChatGPT’nin etkileyici başlangıcından sonra, şirket devam eden bir yavaşlama ile karşı karşıya kaldı ve verilere bakarak GPT-4.5 bir atılım haline gelmedi.

Uzmanlar üzerinde anlaşma: Endüstrinin güven krizinin üstesinden gelmek için kozmetik güncellemeler değil, temel iyileştirmelere ihtiyaç vardır. Bu arada, kullanıcılar nöral ağların düzenli olarak “ortaya çıktıkları” gerçeğine katlanmak zorunda kalıyorlar – ister karmaşık verilerin basit bir sorusunun cevabı olsun, ister bu.

genel-22

ETİKETLENDİ:37sinde AI AI halüsinasyonları cevapların dil modelleri GPT-4.5 GPT4.5 halüsinasyonlar Makine eğitimi modeli OpenAI yanılıyor Yeni

Bu Makaleyi Paylaş

Önceki Makale Xiaomi 15 serisi Google Gemini entegrasyonunu alır; Hyperos 2.0 Global Sunum Zaman Çizelgesi ortaya çıktı

Sonraki Makale

Jennifer Coolidge, Jon Gries’in Greg’in ‘White Lotus’ Sezon 3’ünde Get ” i umduğunu söylüyor

AI Halüsinasyonlar: Yeni Openai GPT-4.5 modeli, cevapların% 37’sinde yanılıyor

Sanal Medya

Son Eklenenler

Apple ve Google’dan Uygulama Düzenlemesi Hamlesi

ChillPill Soğutma Sistemi ile Sıcak Yazlara Veda Edin

Eğlencenin Yeni Dalgası: Mukbang Kodlarıyla Tanışın

Çin’in 2.8 trilyon parametreli Kimi K3, Claude Fable 5’i geride bıraktı

PHP ile AI Ajanları Oluşturma: Laravel ile Araç Çağırma

Teknolojinin Geleceğini Şekillendiren Değişim: Bungie’de Kargaşa Anları

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer