Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, ChatGPT Yanıt Kalitesinde Endişe Verici Düşüş Çizelgesi
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, ChatGPT Yanıt Kalitesinde Endişe Verici Düşüş Çizelgesi

Liste

Araştırmacılar, ChatGPT Yanıt Kalitesinde Endişe Verici Düşüş Çizelgesi

teknomers
Son güncelleme: 20 Temmuz 2023 07:19
teknomers
Paylaş
Paylaş


Son aylarda, ChatGPT yanıtlarının kalitesindeki düşüşe ilişkin anekdot niteliğinde kanıtlar ve genel mırıltılar yükseldi. Stanford ve UC Berkeley’den bir araştırma ekibi, gerçekten bir bozulma olup olmadığını belirlemeye karar verdi ve zararlı değişimin ölçeğini ölçmek için ölçütler buldu. Uzun lafın kısası, ChatGPT kalitesindeki düşüş kesinlikle hayal bile edilemezdi.

Yakın zamanda yayınlanan araştırma makalesinin arkasında üç seçkin akademisyen, Matei Zaharia, Lingjiao Chen ve James Zou vardı. ChatGPT’nin Davranışı Zaman İçinde Nasıl Değişiyor? (PDF) Bugün erken saatlerde, UC Berkeley, Zaharia’da Bilgisayar Bilimleri Profesörü, Twitter’da şunları söyledi: bulguları paylaş. Şaşırtıcı bir şekilde “GPT -4’ün ‘bu sayı asal mı? adım adım düşünün’ konusundaki başarı oranı Mart’tan Haziran’a kadar %97,6’dan %2,4’e düştü.”

GPT-4 oldu genellikle müsait yaklaşık iki hafta önce ve OpenAI tarafından en gelişmiş ve yetenekli modeli olarak savunuldu. Bir dizi yeni yenilikçi AI ürününe güç sağlayabileceği iddia edilerek ödeme yapan API geliştiricilerine hızlı bir şekilde sunuldu. Bu nedenle, yeni çalışmanın bazı oldukça basit sorular karşısında kaliteli yanıtları bu kadar eksik bulması üzücü ve şaşırtıcı.

Yukarıdaki asal sayı sorgularında GPT-4’ün üstün başarısızlık oranının bir örneğini zaten vermiştik. Araştırma ekibi, ChatGPT’nin altında yatan büyük dil modelleri (LLM’ler) GPT-4 ve GPT-3.5’in aşağıdaki niteliksel yönlerini ölçmek için görevler tasarladı. Görevler, çeşitli yapay zeka becerilerini ölçen ve performansı değerlendirmek için nispeten basit olan dört kategoriye ayrılır.

  • Matematik problemlerini çözme
  • Hassas soruları yanıtlamak
  • kod oluşturma
  • Görsel muhakeme

Open AI LLM’lerin performansına genel bir bakış aşağıdaki tabloda verilmiştir. Araştırmacılar, Mart 2023 ve Haziran 2023 sürümleri boyunca GPT-4 ve GPT-3.5 sürümlerinin miktarını belirledi.

ChatGPT kaliteli araştırma

(İmaj kredisi: Matei Zaharia, Lingjiao Chen, James Zou)

“Aynı” LLM hizmetinin sorguları zaman içinde oldukça farklı şekilde yanıtladığı açıkça gösterilmiştir. Nispeten kısa olan bu süre zarfında önemli farklılıklar görülmektedir. Bu LLM’lerin nasıl güncellendiği ve performanslarının bazı yönlerini iyileştirmeye yönelik değişikliklerin diğerlerini olumsuz etkileyip etkilemeyeceği belirsizliğini koruyor. Üç test kategorisinde GPT-4’ün en yeni sürümünün Mart sürümüyle karşılaştırıldığında ne kadar “kötü” olduğunu görün. Görsel muhakemede yalnızca küçük bir marjın kazanılmasından hoşlanır.

ChatGPT kaliteli araştırma

(İmaj kredisi: Matei Zaharia, Lingjiao Chen, James Zou)

Bazıları, bu LLM’lerin ‘aynı sürümlerinde’ gözlemlenen değişken kaliteden rahatsız olmayabilir. Ancak araştırmacılar, “ChatGPT’nin popülaritesi nedeniyle, hem GPT-4 hem de GPT-3.5, bireysel kullanıcılar ve bir dizi işletme tarafından geniş çapta benimsenmiştir.” Bu nedenle, GPT tarafından oluşturulan bazı bilgilerin etkilemesi olasılık sınırlarının ötesinde değildir. senin hayat.

Araştırmacılar, daha uzun bir çalışmada GPT sürümlerini değerlendirmeye devam etme niyetlerini dile getirdiler. Belki de Open AI, ödeme yapan müşterileri için kendi düzenli kalite kontrollerini izlemeli ve yayınlamalıdır. Bu konuda daha net olamıyorsanız, iş dünyası veya devlet kuruluşlarının bu LLM’ler için önemli ticari ve araştırma etkileri olabilecek bazı temel kalite ölçütlerini kontrol etmesi gerekebilir.

Hayır, GPT-4’ü daha aptal yapmadık. Tam tersine, her yeni sürümü bir öncekinden daha akıllı hale getiriyoruz. Mevcut hipotez: Daha yoğun kullandığınızda, daha önce görmediğiniz sorunları fark etmeye başlıyorsunuz.13 Temmuz 2023

Daha fazla gör

AI ve LLM teknolojisi, şaşırtıcı sorunlara ve endüstrinin veri hırsızlığı iddialarına ve diğer PR’a yabancı değil bataklıklarşu anda bağlantılı yaşam ve ticarette en son ‘vahşi batı’ sınırı gibi görünüyor.





genel-21

Samsung Galaxy S23 Ultra sızıntısı, şok edici kamera boyutu çıkıntısını ve hoş bir kullanılabilirlik iyileştirmesini ortaya koyuyor
iQoo 11 5G İlk İzlenimler: 2023 Amiral Gemileri İçin Bir Performans Kıyaslaması Belirleme
Realme Patenti, Tek Elle Çalıştırılabilen Manyetik Bileşenlere Sahip Katlanabilir Cihazı Açıklıyor
Çılgın anlaşma: Media Markt, ücretsiz Buds2 ile Samsung Galaxy S22+’ı deviriyor
Asus, derin cepli alıcılar için Altın RTX 5090’ı piyasaya sürüyor – Rog Astral Geforce RTX 5090 Dhahab OC Edition Orta Doğu Pazarı
ETİKETLENDİ:AraştırmacılarChatGPTÇizelgesiDüşüşendişekalitesindevericiYanıt
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Rusya’ya teslim edilen Toyota Land Cruiser, Camry ve Alphard’ın kaderi henüz belirlenmedi. Japon hükümeti olası bir yasakla ilgili haberlere yorum yaptı
Sonraki Makale Google’ın Hindistan’daki OTT sorunları yeni eklendi

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Google ve FBI siber saldırganları engellemek için uyarıyor
Genel
Kongre, izinsiz gözetim konusunda hâlâ karar veremedi
Liste
Bu Yaz Seyahat Sezonu, Sürdürülebilir Havacılık Yakıtının Geleceğini Değiştirebilir!
Genel
Nvidia’nın 2026 için RTX 50 Super serisi planları ifşa edildi
Donanım
IBM’in Gölgelerindeki Veri İhlalleri Ortaya Çıktı
Genel
Yaz dönemi Oyun Festivali 2026: En Büyük Haberler ve Tanıtımlar
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?