OpenAI, Perşembe günü GPT-4’ün kod oluşturmadaki hatalarını yakalayabilen yeni bir yapay zeka (AI) modeli hakkında bir çalışma yayınladı. Yapay zeka firması, yeni chatbot’un insan geri bildiriminden takviyeli öğrenme (RLHF) çerçevesi kullanılarak eğitildiğini ve GPT-4 modellerinden biri tarafından desteklendiğini belirtti. Henüz geliştirilmeyen sohbet robotu, kullanıcıların büyük dil modellerinden aldığı yapay zeka tarafından oluşturulan kodun kalitesini artırmak için tasarlandı. Şu anda model kullanıcılara veya test uzmanlarına sunulmamaktadır. OpenAI ayrıca modelin bazı sınırlamalarına da dikkat çekti.
OpenAI, CriticGPT Hakkında Ayrıntıları Paylaşıyor
Yapay zeka firması yeni CriticGPT modelinin ayrıntılarını bir Blog yazısıGPT-4’e dayandığını ve ChatGPT tarafından oluşturulan koddaki hataları tespit etmek için tasarlandığını belirterek, “İnsanların ChatGPT kodunu incelemek için CriticGPT’den yardım aldıklarında, yardım almayanlardan %60 oranında daha iyi performans gösterdiklerini gördük,” diyor şirket. Model, RLHF çerçevesi kullanılarak geliştirildi ve bulgular bir kağıt.
RLHF, yapay zeka sistemlerini eğitmek için makine çıktısını insanlarla birleştiren bir makine öğrenme tekniğidir. Böyle bir sistemde, insan değerlendiriciler yapay zekanın performansına ilişkin geri bildirim sağlar. Bu, modelin davranışını ayarlamak ve geliştirmek için kullanılır. Yapay zekaya geri bildirim sağlayan insanlara yapay zeka eğitmenleri denir.
CriticGPT, hatalar içeren büyük miktarda kod verisi üzerinde eğitildi. Yapay zeka modeline bu hataları bulma ve kodu eleştirme görevi verildi. Bunun için yapay zeka eğitmenlerinden, doğal olarak oluşan hataların üzerine koddaki hataları yazmaları ve ardından sanki o hataları yakalamış gibi örnek geri bildirimler yazmaları istendi.
CriticGPT, eleştirisinin çeşitli varyasyonlarını paylaştıktan sonra eğitmenlerden, doğal olarak oluşan hataların yanı sıra ekledikleri hataların da yapay zeka tarafından yakalanıp yakalanmadığını tespit etmeleri istendi. OpenAI, araştırmasında CriticGPT’nin hataları yakalama konusunda ChatGPT’den yüzde 63 daha iyi performans gösterdiğini buldu.
Ancak, modelin hala belirli sınırlamaları var. CriticGPT, OpenAI tarafından üretilen kısa kod dizileri üzerinde eğitildi. Model henüz uzun ve karmaşık görev kümeleri üzerinde eğitilmedi. AI firması ayrıca yeni sohbet robotunun halüsinasyon görmeye (yanlış gerçek yanıtlar üretmeye) devam ettiğini buldu. Ayrıca, model kodda birden fazla hatanın dağıldığı senaryolarda test edilmedi.
Bu modelin, OpenAI’nin daha yüksek kalitede çıktılar üretebilecek eğitim tekniklerini daha iyi anlamasına yardımcı olmak için tasarlandığı için halka açıklanması pek olası değildir. CriticGPT halka açıklanırsa ChatGPT’ye entegre olacağına inanılıyor.
En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin X, Facebook, Naber, İş Parçacığı Ve Google Haberleri. Cihazlar ve teknolojiyle ilgili en son videolar için abone olun Youtube kanalıEn iyi etkileyiciler hakkında her şeyi bilmek istiyorsanız, şirket içi takip edin KimBu360 Açık Instagram Ve Youtube.
Bolivya Bitcoin Yasağını Geri Çekti, Bankalar İçin Kripto İşlemlerini Yasallaştırdı