Son iki haftadır, akşamlarınızı OpenAI’nin müthiş konuşma yapay zekası ChatGPT’yi sorgulayarak geçiriyorsunuz. Ve hatta zanaatınızda kullanmak için planlar yapmaya başlıyorsunuz.
Kuşkusuz, bazı cevaplar kesin değil, hatta topal. Ancak diğer testler size etkileyici bir potansiyel gösteriyor.
Ve şimdi, “sihirli” görünebilecek bir bilgisayar çözümüne yönelik oldukça genel coşkunun ardından, GPT-3 ve ChatGPT’nin yanı sıra rakip araçlar hakkında ilk bilgiler ortaya çıkıyor. Açıkçası, kaputun altında sihir yok. Ama her şeyden önce, biraz yaratıcılık. Çoğunlukla iş tarafından çok az ödenen emek ve daha önce hiç görülmemiş bir ölçekte veri hurdaya çıkarma.
Yapay zekayı tıklama işçileri aracılığıyla eğitin
Time dergisi açıkladı bir yandan OpenAI, ChatGPT’yi daha az toksik hale getirmek için Kenyalı sağlayıcıları kullandı. Daha az toksik mi? Evet, çünkü ChatGPT motoru olan GPT-3, geçmişte şiddet içeren, cinsiyetçi ve ırkçı sözler söyleme konusunda gıpta edilemeyecek bir yetenek göstermiştir.
Neden? Niye ? Çünkü bu yapay zeka, internetten çıkarılan yüz milyarlarca kelime üzerinde eğitildi. Ve tahmin edebilirsiniz ki, bu devasa veri seti zehirli içerik ve apriori payına sahiptir.
Yapay zekayı “eğitmek” için OpenAI bu nedenle bir sohbet robotu sunmak üzere ek bir güvenlik mekanizması yerleştirmek zorunda kaldı.
Ve orada, sürpriz yok, icat yok, sihirli tarif yok. Sosyal ağlar gibi, OpenAI onu halka sunmaya cesaret edemeden ChatGPT’nin görgü kurallarını düzeltenler travma geçirmiş moderatörlerdi.
Hep AI çatısı altında yürütülen bir çalışma. Çünkü ChatGPT’nin modere edici bir yapay zekasını oluşturmaya yardımcı olmak bu sağlayıcıların göreviydi. Nasıl ? Bu yapay zekaya “etiketler”, yani şiddet içeren içerik ve nefret söylemi örnekleri göndererek.
Bu nedenle OpenAI, bu etiketleri elde etmek için Kasım 2021’den itibaren Kenya’daki Sama adlı bir dış kaynak şirketine on binlerce metin parçacığı gönderdi. Açıkçası, bu veri kümesi, çocukların cinsel istismarı, cinayet, intihar veya hatta işkence.
Sama ise kendisini “etik bir AI” şirketi olarak sunuyor ve 50.000’den fazla insanı yoksulluktan kurtarmaya yardımcı olduğunu iddia ediyor. Sam’in OpenAI projesinde istihdam edilen çalışanlarına saatte 1,32 ila 2 dolar arasında ödeme yapıldı.
ChatGPT’yi prezentabl hale getiren bu tıklama çalışanları, AI değer zincirinde hayati bir rol oynar. Çünkü veri bilimcisi konumunun, veri mühendislerinin becerilerinin ötesinde, verileri zenginleştirenler bu işçi ordularıdır. Çoğu zaman görünmez olan, teknoloji devlerinin ortaya koyduğu teknik yeniliklerle maskelenen ordular.
AI ve telif hakkı
Denetleme ve görev tarafından ödenen bir dizi hizmet sağlayıcının kullanılması sorunlarının ötesinde, mevcut AI sistemlerinin uygulanması da bir hukuk sorununu gündeme getiriyor. Makineler tarafından sindirilen derlem veya veri setinde yer alan veri ve bilgilerin telif hakkı ve kullanım haklarına bu nedenle saygı gösterilmeyecektir.
OpenAI’nin bir rakibi ve Stable Diffusion, Midjourney ve DeviantArt platformunun yaratıcısı olan Stability AI’ye karşı toplu bir yasal işlem (toplu dava) bu şekilde resmileştirildi. Davacılar, üretici yapay zekaların milyonlarca korsan eserden eğitildiğini iddia ediyor. Ve tazminat talep ediyorlar.
Burada gündeme getirilen, yazarların eserlerinin kullanılmasına rıza göstermeleridir. Ve bundan sonra yazarların çalışmalarıyla rekabet etmek için kullanılacak olan devasa bir korsanlığı savunmak.
Bu sınıf eylemi yayılabilir ve daha önemli oyuncuları bir araya getirebilir. Dünyanın en büyük görsel bankalarından biri olan Getty Images, Stability AI’yi dava etmekle tehdit ediyor. Şirket, AI uzmanını “milyonlarca telif hakkıyla korunan görüntüyü ve ilgili meta verileri yasa dışı bir şekilde kopyalamak ve işlemek” ile suçluyor.