Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, ChatGPT Yanıt Kalitesinde Endişe Verici Düşüş Çizelgesi
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, ChatGPT Yanıt Kalitesinde Endişe Verici Düşüş Çizelgesi

Liste

Araştırmacılar, ChatGPT Yanıt Kalitesinde Endişe Verici Düşüş Çizelgesi

teknomers
Son güncelleme: 20 Temmuz 2023 07:19
teknomers
Paylaş
Paylaş


Son aylarda, ChatGPT yanıtlarının kalitesindeki düşüşe ilişkin anekdot niteliğinde kanıtlar ve genel mırıltılar yükseldi. Stanford ve UC Berkeley’den bir araştırma ekibi, gerçekten bir bozulma olup olmadığını belirlemeye karar verdi ve zararlı değişimin ölçeğini ölçmek için ölçütler buldu. Uzun lafın kısası, ChatGPT kalitesindeki düşüş kesinlikle hayal bile edilemezdi.

Yakın zamanda yayınlanan araştırma makalesinin arkasında üç seçkin akademisyen, Matei Zaharia, Lingjiao Chen ve James Zou vardı. ChatGPT’nin Davranışı Zaman İçinde Nasıl Değişiyor? (PDF) Bugün erken saatlerde, UC Berkeley, Zaharia’da Bilgisayar Bilimleri Profesörü, Twitter’da şunları söyledi: bulguları paylaş. Şaşırtıcı bir şekilde “GPT -4’ün ‘bu sayı asal mı? adım adım düşünün’ konusundaki başarı oranı Mart’tan Haziran’a kadar %97,6’dan %2,4’e düştü.”

GPT-4 oldu genellikle müsait yaklaşık iki hafta önce ve OpenAI tarafından en gelişmiş ve yetenekli modeli olarak savunuldu. Bir dizi yeni yenilikçi AI ürününe güç sağlayabileceği iddia edilerek ödeme yapan API geliştiricilerine hızlı bir şekilde sunuldu. Bu nedenle, yeni çalışmanın bazı oldukça basit sorular karşısında kaliteli yanıtları bu kadar eksik bulması üzücü ve şaşırtıcı.

Yukarıdaki asal sayı sorgularında GPT-4’ün üstün başarısızlık oranının bir örneğini zaten vermiştik. Araştırma ekibi, ChatGPT’nin altında yatan büyük dil modelleri (LLM’ler) GPT-4 ve GPT-3.5’in aşağıdaki niteliksel yönlerini ölçmek için görevler tasarladı. Görevler, çeşitli yapay zeka becerilerini ölçen ve performansı değerlendirmek için nispeten basit olan dört kategoriye ayrılır.

  • Matematik problemlerini çözme
  • Hassas soruları yanıtlamak
  • kod oluşturma
  • Görsel muhakeme

Open AI LLM’lerin performansına genel bir bakış aşağıdaki tabloda verilmiştir. Araştırmacılar, Mart 2023 ve Haziran 2023 sürümleri boyunca GPT-4 ve GPT-3.5 sürümlerinin miktarını belirledi.

ChatGPT kaliteli araştırma

(İmaj kredisi: Matei Zaharia, Lingjiao Chen, James Zou)

“Aynı” LLM hizmetinin sorguları zaman içinde oldukça farklı şekilde yanıtladığı açıkça gösterilmiştir. Nispeten kısa olan bu süre zarfında önemli farklılıklar görülmektedir. Bu LLM’lerin nasıl güncellendiği ve performanslarının bazı yönlerini iyileştirmeye yönelik değişikliklerin diğerlerini olumsuz etkileyip etkilemeyeceği belirsizliğini koruyor. Üç test kategorisinde GPT-4’ün en yeni sürümünün Mart sürümüyle karşılaştırıldığında ne kadar “kötü” olduğunu görün. Görsel muhakemede yalnızca küçük bir marjın kazanılmasından hoşlanır.

ChatGPT kaliteli araştırma

(İmaj kredisi: Matei Zaharia, Lingjiao Chen, James Zou)

Bazıları, bu LLM’lerin ‘aynı sürümlerinde’ gözlemlenen değişken kaliteden rahatsız olmayabilir. Ancak araştırmacılar, “ChatGPT’nin popülaritesi nedeniyle, hem GPT-4 hem de GPT-3.5, bireysel kullanıcılar ve bir dizi işletme tarafından geniş çapta benimsenmiştir.” Bu nedenle, GPT tarafından oluşturulan bazı bilgilerin etkilemesi olasılık sınırlarının ötesinde değildir. senin hayat.

Araştırmacılar, daha uzun bir çalışmada GPT sürümlerini değerlendirmeye devam etme niyetlerini dile getirdiler. Belki de Open AI, ödeme yapan müşterileri için kendi düzenli kalite kontrollerini izlemeli ve yayınlamalıdır. Bu konuda daha net olamıyorsanız, iş dünyası veya devlet kuruluşlarının bu LLM’ler için önemli ticari ve araştırma etkileri olabilecek bazı temel kalite ölçütlerini kontrol etmesi gerekebilir.

Hayır, GPT-4’ü daha aptal yapmadık. Tam tersine, her yeni sürümü bir öncekinden daha akıllı hale getiriyoruz. Mevcut hipotez: Daha yoğun kullandığınızda, daha önce görmediğiniz sorunları fark etmeye başlıyorsunuz.13 Temmuz 2023

Daha fazla gör

AI ve LLM teknolojisi, şaşırtıcı sorunlara ve endüstrinin veri hırsızlığı iddialarına ve diğer PR’a yabancı değil bataklıklarşu anda bağlantılı yaşam ve ticarette en son ‘vahşi batı’ sınırı gibi görünüyor.





genel-21

Apple Watch’un AFib Geçmişi özelliği, güvenilir bir araç olarak FDA’nın onayını alıyor
Sony arkadaşlarım için: Otto’da en düşük fiyata Xperia 5 III
Tüm Tatooine Güç Oyuncuları
OpenAI Startup Fund, ikinci Converge startup grubunu başlattı
AI kalp sağlığının erken teşhisi için Insight Partners’tan akıllıca 106 milyon dolar topladı
ETİKETLENDİ:AraştırmacılarChatGPTÇizelgesiDüşüşendişekalitesindevericiYanıt
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Rusya’ya teslim edilen Toyota Land Cruiser, Camry ve Alphard’ın kaderi henüz belirlenmedi. Japon hükümeti olası bir yasakla ilgili haberlere yorum yaptı
Sonraki Makale Google’ın Hindistan’daki OTT sorunları yeni eklendi

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil! Toshiba ve Muji websitelerinde şüpheli giriş uyarıları ortaya çıktı
Siber Güvenlik
Tatiliniz İçin 13 Çevre Dostu Paketleme İpucu ile Fark Yaratın
Genel
Kurucular VC korku hikayelerini paylaşıyor, bazıları isimleri veriyor
Genel
Control Resonant devam niteliğinde ama aynı zamanda bir başlangıç noktası mı?
Liste
Anthropic, Claude AI’nin beklenenden hızlı geliştiğini uyardı
Donanım
EA Sports’un Yeni Abonelik Sistemi Oyuncuları Heyecanlandıracak
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?