Facebook Ebeveyn Şirketi Meta şu anda, Lama’nın nasıl eğitildiği ile ilgili olarak, diğerlerinin yanı sıra telif hakkı ihlali ve haksız rekabeti iddia eden bir sınıf eylem davasıyla mücadele ediyor. Bir X (eski Twitter) yazısına göre VX-UndergroundMahkeme kayıtları, sosyal medya şirketinin Anna’nın Arşivi, Z-Library ve Libgen de dahil olmak üzere gölge kütüphanelerinden 81.7 TB veri indirmek için korsan torrentler kullandığını ortaya koydu. Daha sonra bu bilgileri AI modellerini eğitmek için kullandı.
Kanıt, yazılı iletişim şeklinde, araştırmacıların Meta’nın korsan malzeme kullanımı hakkındaki endişelerini göstermektedir. Bir kıdemli AI araştırmacısı Ekim 2022’de “Korsan malzeme kullanmamız gerektiğini sanmıyorum. Gerçekten burada bir çizgi çizmem gerekiyor. ” Bir diğeri, “Korsan materyali kullanmak etik eşiğimizin ötesinde olmalı” derken, “SciHub, Researchgate, Libgen temelde Piratebay veya bunun gibi bir şey gibidir, telif hakkı ile korunan içeriği dağıtıyorlar ve ihlal ediyorlar BT.”

Sonra, Ocak 2023’te Mark Zuckerberg, “Bu şeyleri ileriye taşımalıyız … tüm bunları engellemenin bir yolunu bulmalıyız” dediği bir toplantıya katıldı. Yaklaşık üç ay sonra, bir meta çalışanı, “korsan içeriği yoluyla yüklemek için” kullanılan Meta IP adreslerinden endişe duyduklarını söyleyen bir meta çalışanı bir mesaj gönderdi. Ayrıca, “Kurumsal bir dizüstü bilgisayardan Torrenting’in doğru hissetmediğini” de ekledi, ardından yüksek sesle emoji.
Bu mesajların yanı sıra, belgeler de şirketin bu indirme ve tohumlama işlemlerinde altyapısının kullanılmaması için adımlar attığını, böylece etkinliğin Meta’ya kadar izlenmeyeceğini ortaya koydu. Mahkeme belgeleri, bunun Meta’nın yasadışı faaliyetlerinin kanıtını oluşturduğunu söylüyor, bu da telif hakkı yasalarını atlatmak için kasıtlı adımlar atıyor gibi görünüyor.
Ancak, bir AI eğitim modeli ilk kez internetten bilgi çalmakla suçlanmamıştır. Openai, Romancılar tarafından Haziran 2023’e kadar büyük dil modellerini eğitmek için kitaplarını kullandıkları için dava açıldı ve The New York Times Aralık ayında dava açtı. Nvidia, yazarlar tarafından o zamandan beri devredilen Nemo modelini eğitmek için 196.640 kitap kullandıkları için açılan bir davanın alıcı ucunda. Eski bir Nvidia çalışanı, geçen yılın Ağustos ayında şirketteki düdüğü havaya uçurdu ve AI eğitiminde kullanım için günde 426 bin saatten fazla videoyu kazındığını söyledi. Daha yakın zamanlarda Openai, Deepseek’in CHATGPT’den yasadışı bir şekilde veri elde edip etmediğini araştırıyor, bu da ironik şeylerin nasıl olabileceğini gösteriyor.
Meta’ya karşı dava hala devam ediyor, bu nedenle mahkeme, şirketin doğrudan ihlal işlemiş olup olmadığını söyleme kararını serbest bırakana kadar beklememiz gerekecek. Ve yazarlar bu davayı kazansa bile, Meta, büyük mali savaş sandığı ile muhtemelen kararı temyiz edecek, yani son mahkeme kararını görmek için yıllar olmasa da birkaç ay beklememiz gerekecek.

