Pazar günü Kaliforniya Valisi Gavin Newsom, üretken yapay zeka sistemleri geliştiren şirketlerin sistemlerini eğitmek için kullandıkları verilerin üst düzey bir özetini yayınlamalarını zorunlu kılan AB-2013 yasasını imzaladı. Diğer hususların yanı sıra özetler, verinin kime ait olduğunu, nasıl temin edildiğini veya lisanslandığını ve ayrıca telif hakkıyla korunan veya kişisel bilgileri içerip içermediğini de kapsamalıdır.

Çok az yapay zeka şirketi buna uyup uymayacağını söylemeye istekli.

TechCrunch, OpenAI, Anthropic, Microsoft, Google, Amazon, Meta ve yeni kurulan Stability AI, Midjourney, Udio, Suno, Runway ve Luma Labs dahil olmak üzere AI alanındaki büyük oyunculara ulaştı. Yarıdan azı yanıt verdi ve bir satıcı (Microsoft) açıkça yorum yapmayı reddetti.

Yalnızca Stabilite, Runway ve OpenAI TechCrunch’a AB-2013’e uyacaklarını söyledi.

Bir OpenAI sözcüsü, “OpenAI, bu da dahil olmak üzere faaliyet gösterdiğimiz yargı bölgelerindeki yasalara uyuyor” dedi. İstikrar sözcüsü, şirketin “kamuoyunu korurken aynı zamanda yeniliği engellemeyen düşünceli düzenlemeleri desteklediğini” söyledi.

Adil olmak gerekirse, AB-2013’ün açıklama gereklilikleri hemen yürürlüğe girmiyor. Bunlar, Ocak 2022’de veya sonrasında piyasaya sürülen sistemler için geçerli olsa da (birkaç örnek vermek gerekirse ChatGPT ve Stable Diffusion), şirketlerin eğitim verileri özetlerini yayınlamaya başlamak için Ocak 2026’ya kadar süreleri var. Yasa aynı zamanda yalnızca Kaliforniyalıların kullanımına sunulan sistemler için de geçerli ve biraz hareket alanı bırakıyor.

Ancak satıcıların bu konudaki sessizliğinin başka bir nedeni daha olabilir ve bu, çoğu üretken yapay zeka sisteminin eğitilme şekliyle ilgilidir.

Eğitim verileri sıklıkla web’den gelir. Satıcılar web sitelerinden çok miktarda resim, şarkı, video ve daha fazlasını topluyor ve sistemlerini bunlar üzerinde eğitiyor.

Yıllar önce, yapay zeka geliştiricilerinin eğitim verilerinin kaynaklarını, genellikle modelin çıkışıyla birlikte gelen teknik bir belgede listelemeleri standart bir uygulamaydı. Örneğin Google bir keresinde imaj oluşturma model ailesi Imagen’in ilk versiyonunu kamuoyuna tanıttığını açıklamıştı. LAION veri seti. Birçok daha yaşlı evraklar Akademik çalışmaları ve kod tabanlarını içeren açık kaynaklı bir eğitim metni koleksiyonu olan The Pile’dan bahsedin.

Günümüzün acımasız pazarında, eğitim veri setlerinin oluşturulması bir rekabet avantajı olarak görülüyor ve şirketler bundan alıntı yap ifşa edilmemelerinin ana nedenlerinden biri olarak. Ancak eğitim verilerinin ayrıntıları geliştiricilerin sırtına yasal bir hedef de çizebilir. LAION’a bağlantılar telif hakkıyla korunan Ve gizliliği ihlal eden The Pile şunları içerirken görüntüler Kitaplar3Stephen King ve diğer yazarların korsan eserlerinden oluşan bir kütüphane.

Zaten çok sayıda var davalar üzerinde eğitim verilerinin kötüye kullanılması ve daha fazlası her ay bildirilmektedir.

Yazarlar Ve yayıncılar iddia OpenAI, Anthropic ve Meta’nın eğitim için bazıları Books3’ten olmak üzere telif hakkıyla korunan kitapları kullandığını söyledi. Müzik şirketleri Udio ve Suno’yu müzisyenlere tazminat ödemeden şarkı eğitimi verdikleri iddiasıyla mahkemeye verdi. Ve sanatçılar var toplu davalar açtık Hırsızlık anlamına gelen veri kazıma uygulamaları olduğunu söyledikleri için Stabilite ve Midjourney’e karşı.

Mahkeme salonundaki kavgaları uzak tutmaya çalışan satıcılar için AB-2013’ün nasıl sorunlu olabileceğini görmek zor değil. Kanun, eğitim veri kümeleriyle ilgili, kümelerin ilk ne zaman kullanıldığını ve veri toplamanın devam edip etmediğini belirten bir bildirim de dahil olmak üzere, potansiyel olarak suçlayıcı olabilecek bir dizi spesifikasyonun kamuya açıklanmasını zorunlu kılmaktadır.

AB-2013’ün kapsamı oldukça geniştir. Bir yapay zeka sistemini “büyük ölçüde değiştiren” (yani sisteme ince ayar yapan veya yeniden eğiten) herhangi bir kuruluş, Ayrıca Bunu yapmak için kullandıkları eğitim verileri hakkında bilgi yayınlamak zorunda kaldılar. Kanunda birkaç tane var oymalarancak bunlar çoğunlukla siber güvenlik ve savunmada kullanılan, örneğin “ulusal hava sahasında uçakların işletilmesi” için kullanılan yapay zeka sistemleri için geçerlidir.

Elbette birçok satıcı, adil kullanım olarak bilinen doktrinin yasal koruma sağladığına inanıyor ve bunu mahkemede ileri sürüyorlar ve halka açık ifadeler. Meta ve Google gibi bazıları sahip olmak değişti Eğitim için daha fazla kullanıcı verisinden yararlanmalarına olanak sağlamak amacıyla platformlarının ayarları ve hizmet şartları.

Rekabet baskıları ve sonunda adil kullanım savunmalarının kazanacağına dair bahislerin teşvik ettiği bazı şirketler, fikri mülkiyet korumalı veriler konusunda özgürce eğitim aldı. Raporlama Reuters, Meta’nın bir noktada kendi avukatlarının uyarılarına rağmen yapay zeka eğitimi için telif hakkıyla korunan kitapları kullandığını ortaya çıkardı. var kanıt Runway, video oluşturma sistemlerini eğitmek için Netflix ve Disney filmlerinden yararlandı. Ve OpenAI bildirildiğine göre GPT-4 de dahil olmak üzere modeller geliştirmek için içerik oluşturucuların bilgisi olmadan YouTube videolarının yazıya geçirilmesi.

Daha önce de yazdığımız gibi, üretken yapay zeka satıcılarının sistem eğitimi verilerinin ifşa edilmesinden ya da hiçbir ceza almadan kurtulacağı bir sonuç var. Mahkemeler sonunda adil kullanımı savunanların yanında yer alabilir ve üretken yapay zekanın yeterince dönüştürücü – ve intihal motoru değil The New York Times ve diğer davacılar öyle olduğunu iddia ediyor.

Daha dramatik bir senaryoda, AB-2013, satıcıların belirli modelleri Kaliforniya’da tutmasına veya modellerin yalnızca adil kullanım ve lisanslı veri kümeleri konusunda eğitim almış Kaliforniyalılar için sürümlerini yayınlamasına yol açabilir. Bazı satıcılar, AB-2013 ile ilgili en güvenli eylem planının, uzlaşmacı ve dava açılmasını önleyen açıklamalar olduğuna karar verebilir.

Yasaya itiraz edilmediğini ve/veya yasanın yürürlükten kaldırılmadığını varsayarsak, AB-2013’ün son teslim tarihine kadar bir yıl kadar sonra net bir tabloya sahip olacağız.



genel-24