Ne bilmek istiyorsun
- OpenAI, ChatGPT kullanılarak oluşturulan kodlardaki hataların belirlenmesine yardımcı olmak amacıyla yakın zamanda CriticGPT’yi kullanıma sundu.
- Araç, yapay zeka eğitmenlerinin hataları, yapay zekanın yardımı olmadan normalde yapabileceklerinden daha hızlı ve kolay bir şekilde belirlemelerine yardımcı oluyor.
- ChatGPT üreticisi, aracın %100 doğru olmadığını ve son derece karmaşık görevleri ve periyodik halüsinasyon durumlarını idare edememe gibi çeşitli zorluklarla karşı karşıya olduğunu kabul ediyor.
OpenAI yakın zamanda GPT-4 destekli CriticGPT başlatıldıAdından da anlaşılacağı gibi, model “ChatGPT’nin kod çıktısındaki hataları insan eğitmenlerin tespit etmesine yardımcı olmak için ChatGPT yanıtlarına yönelik eleştiriler yazıyor”.
ChatGPT yapımcısına göre:
“İnsanların ChatGPT kodunu incelemek için CriticGPT’den yardım aldıklarında, yardım almayanlardan %60 oranında daha iyi performans gösterdiklerini gördük. Eğitmenlerimize açık AI yardımı sağlayarak CriticGPT benzeri modelleri RLHF etiketleme hattımıza entegre etmek için çalışmaya başlıyoruz.”
OpenAI, ChatGPT’yi daha “yardımcı ve etkileşimli” hale getirmek için İnsan Geri Bildiriminden Güçlendirme Öğrenimi (RLHF) kullanmayı planlıyor. Bu sürecin ayrılmaz bir parçası, AI eğitmenlerinden karşılaştırmalar toplamaktır. Bu, farklı ChatGPT yanıtlarını birbirlerine göre nasıl derecelendirdiklerine dayanır.
CriticGPT, ChatGPT’nin muhakeme yeteneklerini geliştirmeye yardımcı olacak ve sonuç olarak halüsinasyonları veya yanlış yanıtların ve yanlış bilgilerin üretilmesini azaltacaktır. Gerçek şu ki, ChatGPT ilerledikçe AI eğitmenlerinin hataları belirlemesi giderek zorlaşıyor.
Araç, öncelikle ChatGPT yanıtlarındaki yanlışlıkları vurgulayan eleştirileri belirlemek ve yazmak için eğitilmiştir. OpenAI, aracın her zaman %100 doğru olmadığını kabul ediyor, ancak AI eğitmenlerinin hataları, AI olmadan normalde olduğundan daha hızlı ve kolay bir şekilde belirlemelerine yardımcı oluyor.
CriticGPT’nin becerileri artıracağı ve nihayetinde insanları daha kapsamlı eleştiri teknikleriyle donatacağı bildiriliyor. AI eğitmenleri ve CriticGPT işi ayrı varlıklar olarak halledebilirken, İnsan+CriticGPT kombinasyonu doğru ve ayrıntılı eleştiriler sağlarken oldukça popüler ve kapsamlı görünüyor.
OpenAI’nin bulgularına göre:
“Eğitmenlerin doğal olarak oluşan hatalar konusunda %63 oranında CriticGPT eleştirilerini ChatGPT eleştirilerine tercih ettiğini görüyoruz. Bunun bir nedeni de yeni eleştirmenin daha az “kusur bulma” (yardımcı olmayan küçük şikayetler) üretmesi ve daha az sıklıkla sorun halüsinasyonu yapması.”
CriticGPT hala yapım aşamasındadır
Etkileyici olsa da, CriticGPT’nin hala çok fazla çalışmaya ihtiyacı var. OpenAI, modelin aşağıda listelenen eksikliklerini vurguladı:
- CriticGPT’yi oldukça kısa olan ChatGPT cevapları konusunda eğittik. Geleceğin ajanlarını denetlemek için, eğitmenlerin uzun ve karmaşık görevleri anlamalarına yardımcı olabilecek yöntemler geliştirmemiz gerekecek.
- Modeller hala halüsinasyon görüyor ve bazen eğitmenler bu halüsinasyonları gördükten sonra etiketleme hataları yapıyor.
- Bazen gerçek dünyadaki hatalar bir cevabın birçok bölümüne yayılabilir. Çalışmamız tek bir yerde gösterilebilen hatalara odaklanıyor, ancak gelecekte dağınık hataları da ele almamız gerekiyor.
- CriticGPT’nin ancak belli bir yere kadar yardımı olabilir: Bir görev veya yanıt aşırı derecede karmaşıksa, model yardımı alan bir uzman bile onu doğru bir şekilde değerlendiremeyebilir.
Gelecekte OpenAI, GPT-4 eğitimi için RLHF verilerini iyileştirerek CriticGPT ile daha büyük zirvelere ulaşmayı amaçlıyor. Ayrı bir raporda, Oxford araştırmacıları yanıtların kalitesini belirlemek ve halüsinasyon izlerini tespit etmek için üretilen çıktıların kalitesini ve anlamlarını değerlendirmek amacıyla semantik entropiyi kullandılar.
Yapay zeka modelleri daha gelişmiş ve sofistike hale geliyor ve bu da karmaşık görevleri daha iyi halletmelerine olanak sağlıyor. NVIDIA CEO’su Jensen Huang, kodlamanın gelecek nesil için bir kariyer seçeneği olarak suya düşmüş olabileceğini savunuyor. OpenAI GPT-4o’nun kodlama yetenekleri bir gösterge ise Huang tamamen haksız olmayabilir. Bunun yerine, biyoloji, eğitim, üretim veya çiftçilik alanlarında alternatif kariyer seçenekleri aramayı öneriyor.