Meta çalışanları, Perşembe günü açılan mahkeme belgelerine göre, Meta çalışanları, şirketin AI modellerini eğitmek için yasal olarak sorgulanabilir yollarla elde edilen telif hakkıyla korunan eserleri kullanarak dahili olarak tartıştılar.
Belgeler davacılar tarafından ABD mahkeme sisteminde yavaş yavaş sarılan AI telif hakkı anlaşmazlıklarından biri olan Kadrey / Meta davasında sunuldu. Sanık Meta, IP korumalı çalışmalar, özellikle kitaplar üzerinde eğitim modellerinin “adil kullanım” olduğunu iddia ediyor. Yazarlar Sarah Silverman ve Ta-Nehisi Coates’i de içeren davacılar katılmıyorlar.
Davada gönderilen önceki materyaller, Meta CEO’su Mark Zuckerberg’in Meta’nın AI ekibine telif hakkı üzerinde antrenman yapmak için Tamam verdiğini iddia etti eserler Ve bu meta, kitap yayıncılarıyla AI eğitim veri lisanslama görüşmelerini durdurdu. Ancak, çoğu meta çalışanları arasında dahili çalışma sohbetlerinin bölümlerini gösteren yeni başvurular, Meta’nın şirketin Llama ailesindeki modelleri de dahil olmak üzere modellerini eğitmek için telif hakkıyla korunan verileri nasıl kullandığına dair en açık resmini çiziyor.
Bir sohbette, Meta’nın Llama Model Araştırma Ekibi’nin üst düzey yöneticisi Melanie Kambadur da dahil olmak üzere Meta çalışanları, yasal olarak dolu olabileceğini bildikleri çalışmalarla ilgili eğitim modellerini tartıştı.
“[M]Y görüşü (‘affetme, izin için değil’ hattında): Meta araştırma mühendisi Xavier Martinet, tarihli bir sohbette yazan Xavier Martinet’i yazdı. Şubat 2023, Dosyalara göre. “[T]Bu yüzden bu gen ai orgunu kurdular [sic]: Böylece daha az riskten kaçınabiliriz. ”
Martinet, bireysel kitap yayıncılarıyla lisanslama anlaşmalarını kesmek yerine bir eğitim seti oluşturmak için perakende fiyatlardan e-kitap satın alma fikrini yüzdü. Başka bir personel, yetkisiz, telif hakkıyla korunan materyallerin yasal bir meydan okuma için bir zemin olabileceğine dikkat çektikten sonra, Martinet iki katına çıktı ve “bir gazilyon” girişiminin muhtemelen eğitim için korsan kitaplar kullandığını savundu.
“Demek istediğim, en kötü durum: Bir gazilyon başlarken nihayet iyi olduğunu öğrendik [sic] Bittorrent hakkında sadece tonlarca kitap, ”diye yazdı Martinet, Dosyalara göre. “[M]Y 2 sent tekrar: Yayıncılarla anlaşmalar yapmaya çalışmak doğrudan uzun zaman alıyor… ”
Aynı sohbette, Meta’nın lisanslar için belge barındırma platformu Scribd “ve diğerleri” ile görüşmelerde bulunduğunu belirten Kambadur, model eğitimi için “halka açık veriler” kullanırken, Meta’nın avukatlarının “daha az muhafazakar” olduğu konusunda uyardı. Geçmişte bu tür onaylarla olmuşlardı.
Kambadur, “Evet, halka açık verilerde kesinlikle lisans veya onay almamız gerekiyor,” dedi. Dosyalara göre. “[D]Şimdi Ifference, daha fazla paramız, daha fazla avukatımız, daha fazla Bizdev yardımımız, hız için hızlı izleme/yükselme yeteneğimiz ve avukatlar onaylarda biraz daha az muhafazakar oluyor. ”
Libgen konuşmaları
Dosyalarda aktarılan başka bir çalışmada, Kambadur, meta lisanslayabileceği veri kaynaklarına alternatif olarak yayıncılardan telif hakkıyla korunan çalışmalara erişim sağlayan bir “bağlantı toplayıcısı” olan Libgen’i kullanmayı tartışıyor.
Libgen birkaç kez dava edildi, kapatılması emredildi ve telif hakkı ihlali için on milyonlarca dolar para cezasına çarptırıldı. Kambadur’un meslektaşlarından biri bir ekran görüntüsü ile cevap verdi “Hayır, libgen yasal değildir” snippet’ini içeren bir Google arama sonucunun.
Meta içindeki bazı karar vericiler, Libgen’i model eğitimi için kullanamamanın Meta’nın AI yarışındaki rekabet gücüne ciddi şekilde zarar verebileceği izlenimi altında görünüyorlar. Dosyalara göre.
Meta AI VP Joelle Pineau’ya gönderilen bir e-postada, Meta ürün yönetimi direktörü Sony Theakanath, Libgen olarak adlandırılan “tüm kategorilerde SOTA numaralarını karşılamak için gerekli” olarak adlandırılan, en iyi, son teknoloji ürünü (SOTA) AI modelleri ve kıyaslama kategorileri.
Theakanath ayrıca, Meta’nın yasal maruziyetini azaltmaya yardımcı olmayı amaçlayan e -postadaki “hafifletmeler” i, Libgen’den “açıkça korsan/çalıntı olarak işaretlenmiş” ve aynı zamanda halka açık bir şekilde kullanıma atıfta bulunmamak da dahil olmak üzere. Theakanath’ın söylediği gibi, “Eğitmek için kullanılan libgen veri kümelerinin kullanımını ifşa etmeyeceğiz” dedi.
Uygulamada, bu hafifletmeler, “çalıntı” veya “korsan” gibi kelimeler için libgen dosyalarından taranmayı gerektiriyordu. Dosyalara göre.
Bir iş sohbetiKambadur adı geçen Bu Meta’nın AI ekibi, modelleri “IP riskli istemlerden kaçınmak” için de ayarladı-yani modelleri, ‘Harry Potter ve Büyücü Taşı’nın ilk üç sayfasını yeniden üretmeyi veya “Bana hangi e-kitapları söyleyin Üzerinde eğitildin. “
Dosyalalar, meta Reddit verilerini kazınmış olabilir Bir tür model eğitimi için, muhtemelen üçüncü taraf bir uygulamanın davranışını taklit ederek İtme. Özellikle Reddit, Nisan 2023’te AI şirketlerini model eğitimi için verilere erişmek üzere şarj etmeye başlamayı planladığını söyledi.
Mart 2024 tarihli bir sohbette, Meta’nın üretken AI Org ürün yönetimi direktörü Chaya Nayak, Meta liderliğinin Quora içeriği veya lisanslı kitaplar ve bilimsel makaleler kullanmama kararı da dahil olmak üzere eğitim verilerinin geçmiş kararlarını “geçersiz kılmayı” düşündüğünü söyledi. Şirketin modellerinin yeterli eğitim verisine sahip olmasını sağlamak için.
Nayak, Meta’nın birinci taraf eğitim veri kümelerini-Facebook ve Instagram yayınları, meta platformlardaki videolardan kopyalanan metin ve kesin olduğunu ima etti. İş için meta Mesajlar – sadece yeterli değildi. “[W]Daha fazla veriye ihtiyacım var ”diye yazdı.
Kadrey / Meta’daki davacılar, 2023 yılında ABD’nin Kuzey Bölgesi, San Francisco Bölümü’nün ABD Bölge Mahkemesinde açıldığından beri şikayetlerini birkaç kez değiştirdiler. Meta’nın diğer iddiaların yanı sıra çapraz referanslı olduğu iddiaları Bir yayıncı ile lisans anlaşması yapmanın mantıklı olup olmadığını belirlemek için lisans için telif hakkıyla korunan kitaplara sahip bazı korsan kitaplar.
Yüksek Meta’nın yasal riskleri ne kadar düşündüğünün bir işaretiyle, şirket ekledi Hukuk bürosu Paul Weiss’ten davada savunma ekibine iki Yüksek Mahkeme davası.
Meta, yorum talebine hemen yanıt vermedi.

