ChatGPT ve diğer büyük dil modeli yapay zeka sistemlerini çevreleyen medya çılgınlığı, sıradan – büyük dil modelleri geleneksel web aramasının yerini alabilir – ilgili – AI birçok işi ortadan kaldıracak – ve aşırıya kaçan – AI bir yok oluşa neden oluyor gibi bir dizi temayı kapsıyor insanlık için seviyeli bir tehdit.
Tüm bu temaların ortak bir paydası var: Büyük dil modelleri, insanlığın yerini alacak yapay zekanın habercisi.
Ancak büyük dil modelleri, tüm karmaşıklıklarına rağmen aslında gerçekten aptalca. Ve “yapay zeka” ismine rağmen, tamamen insan bilgisine ve emeğine bağımlıdırlar. Elbette güvenilir bir şekilde yeni bilgi üretemezler, ancak bundan daha fazlası var.
ChatGPT, insanlar ona yeni içerik vermeden ve bu içeriği nasıl yorumlayacağını söylemeden, modeli programlamadan ve donanımını oluşturmadan, bakımını yapmadan ve güçlendirmeden öğrenemez, geliştiremez ve hatta güncel kalamaz. Nedenini anlamak için öncelikle ChatGPT ve benzeri modellerin nasıl çalıştığını ve insanların bu modellerin çalışması için oynadığı rolü anlamalısınız.
ChatGPT nasıl çalışır?
ChatGPT gibi büyük dil modelleri, genel olarak, eğitim veri kümelerine dayalı olarak hangi karakterlerin, sözcüklerin ve cümlelerin birbirini sırayla izlemesi gerektiğini tahmin ederek çalışır. ChatGPT söz konusu olduğunda, eğitim veri seti internetten kazınmış çok büyük miktarlarda herkese açık metin içerir.
Bir dil modelini aşağıdaki cümleler üzerine eğittiğimi hayal edin: Ayılar büyük, tüylü hayvanlardır. Ayıların pençeleri vardır. Ayılar gizli robotlardır. Ayıların burunları vardır. Ayılar gizli robotlardır. Ayılar bazen balık yerler. Ayılar gizli robotlardır.
Model bana ayıların gizliden gizliye robotlar olduğunu söylemeye her şeyden daha yatkın olacaktır, çünkü bu kelime dizisi en sık eğitim veri setinde görünür. Bu açıkça, yanılabilir ve tutarsız veri kümeleri üzerinde eğitilmiş modeller için bir sorundur – ki bunların hepsi, hatta akademik literatürdür.
İnsanlar kuantum fiziği, Joe Biden, sağlıklı beslenme veya 6 Ocak ayaklanması hakkında bazıları diğerlerinden daha geçerli birçok farklı şey yazıyor. İnsanlar pek çok farklı şey söylerken, model bir şey hakkında ne söyleyeceğini nasıl bilecek? Geri bildirim ihtiyacı Geri bildirim burada devreye giriyor. ChatGPT kullanıyorsanız, yanıtları iyi veya kötü olarak derecelendirme seçeneğiniz olduğunu fark edeceksiniz. Onları kötü olarak derecelendirirseniz, iyi bir cevabın neleri içereceğine dair bir örnek vermeniz istenecektir. ChatGPT ve diğer büyük dil modelleri, kullanıcılardan, geliştirme ekibinden ve çıktıyı etiketlemek için işe alınan yüklenicilerden gelen geri bildirimlerle hangi yanıtların, hangi metin dizilerinin tahmin edildiğinin iyi ve kötü olduğunu öğrenir.
ChatGPT bağımsız değişkenleri veya bilgileri kendi başına karşılaştıramaz, analiz edemez veya değerlendiremez. Yalnızca diğer insanların karşılaştırırken, analiz ederken veya değerlendirirken kullandıklarına benzer metin dizileri oluşturabilir, geçmişte iyi cevaplar olduğu söylenenlere benzer olanları tercih eder.
Bu nedenle, model size iyi bir yanıt verdiğinde, ona neyin iyi yanıt olup neyin iyi olmadığını söylemek için halihazırda harcanmış olan büyük miktarda insan emeğinden yararlanıyor demektir. Ekranın arkasına gizlenmiş pek çok insan işçi var ve modelin gelişmeye devam etmesi veya içerik kapsamının genişletilmesi için bunlara her zaman ihtiyaç duyulacak.
Gazeteciler tarafından Time dergisinde yayınlanan yakın tarihli bir araştırma, yüzlerce Kenyalı işçinin ChatGPT’ye bu tür şeyleri kopyalamamayı öğretmek için internetin en karanlık derinliklerinden cinsel şiddetin grafik açıklamaları da dahil olmak üzere ırkçı, cinsiyetçi ve rahatsız edici yazıları okuyup etiketleyerek binlerce saat harcadığını ortaya çıkardı. içerik.
Onlara saatte 2 dolardan fazla ödeme yapılmadı ve birçoğu anlaşılır bir şekilde bu iş nedeniyle psikolojik sıkıntı yaşadıklarını bildirdi.
ChatGPT’nin yapamayacağı şeyler
Geribildirimin önemi doğrudan ChatGPT’nin “halüsinasyon görme” eğiliminde görülebilir; yani, güvenle yanlış cevaplar verin. ChatGPT, o konuyla ilgili iyi bilgiler internette yaygın olarak mevcut olsa bile, eğitim almadan bir konuda iyi yanıtlar veremez.
ChatGPT’ye gitgide daha az belirsiz şeyler sorarak bunu kendiniz deneyebilirsiniz. ChatGPT’den farklı kurmaca eserlerin olay örgüsünü özetlemesini istemeyi özellikle etkili buldum çünkü öyle görünüyor ki, model kurmacadan çok kurgu dışı üzerine eğitilmiş.
Kendi testlerimde ChatGPT, JRR’nin olay örgüsünü özetledi. Tolkien’in Yüzüklerin Efendisi, sadece birkaç hata ile çok ünlü bir roman. Ama Gilbert ve Sullivan’ın özetleri Penzance Korsanları ve Ursula K. Le Guin’in Karanlığın Sol Eli – her ikisi de biraz daha niş ama belirsiz olmaktan uzak – karakter ve yer adlarıyla Mad Libs oynamaya yaklaşın. Bu eserlerin ilgili Wikipedia sayfalarının ne kadar iyi olduğu önemli değil. Modelin yalnızca içeriğe değil, geri bildirime ihtiyacı vardır.
Büyük dil modelleri bilgiyi gerçekten anlamadığı veya değerlendirmediği için, bunu onlar için yapacak insanlara bağımlıdır. İnsan bilgisi ve emeği üzerinde asalaktırlar. Eğitim veri setlerine yeni kaynaklar eklendiğinde, bu kaynaklara dayalı olarak cümlelerin kurulup kurulmayacağı ve nasıl oluşturulacağı konusunda yeni eğitimlere ihtiyaç duyarlar.
Haberlerin doğru olup olmadığını değerlendiremezler. Argümanları değerlendiremezler veya değiş tokuşları tartamazlar. Bir ansiklopedi sayfasını bile okuyamazlar ve sadece onunla tutarlı açıklamalar yaparlar veya bir filmin konusunu doğru bir şekilde özetlerler. Tüm bunları onlar için yapması için insanlara güveniyorlar.
Daha sonra, insanların söylediklerini başka kelimelerle ifade eder ve yeniden düzenlerler ve daha fazla insanın onlara iyi bir şekilde başka sözcüklerle ifade edip etmediklerini ve yeniden karıştırıp karıştırmadıklarını söylemelerine güvenirler. Bazı konulardaki ortak görüş değişirse – örneğin, tuzun kalbiniz için kötü olup olmadığı veya erken meme kanseri taramalarının yararlı olup olmadığı – yeni fikir birliğini dahil etmek için kapsamlı bir şekilde yeniden eğitilmeleri gerekecektir.
Perde arkasında birçok insan Kısacası, tamamen bağımsız yapay zekanın habercisi olmaktan çok uzak olan büyük dil modelleri, birçok yapay zeka sisteminin yalnızca tasarımcılarına ve bakımcılarına değil, kullanıcılarına da tamamen bağımlı olduğunu gösteriyor. Bu nedenle, ChatGPT size bir şey hakkında iyi veya yararlı bir yanıt verirse, çözdüğü kelimeleri yazan ve ona iyi ve kötü yanıtların ne olduğunu öğreten binlerce veya milyonlarca gizli kişiye teşekkür etmeyi unutmayın.
ChatGPT, otonom bir süper zeka olmaktan çok uzak, tüm teknolojiler gibi bizsiz bir hiçtir.