Üretken yapay zeka devreye girerken ana akım, her yeni gün yeni bir dava getiriyor.

Microsoft, GitHub ve OpenAI şu anda dava edildi içinde sınıf eylemi hareketi Milyarlarca genel kod satırı üzerinde eğitilmiş bir kod üreten yapay zeka sistemi olan Copilot’un, kredi sağlamadan lisanslı kod parçacıklarını yeniden canlandırmasına izin vererek onları telif hakkı yasasını ihlal etmekle suçluyor.

Popüler AI sanat araçları Midjourney ve Stability AI’nin arkasındaki iki şirket, bir hedef noktasında. Yasal durum araçlarını web’den kazınmış görüntüler üzerinde eğiterek milyonlarca sanatçının haklarını ihlal ettiklerini iddia ediyor.

Ve daha geçen hafta, stok görüntü tedarikçisi Getty Images, Stability AI’yi mahkemeye verdi. bildirildiğine göre Sanat üreten bir yapay zeka olan Stable Diffusion’ı eğitmek için izinsiz olarak sitesinden milyonlarca görüntü kullanmak.

Esas olarak, üretici yapay zekanın kendisini eğitmek için kullanılan verilerden görüntüleri, metinleri ve daha fazlasını – telif hakkıyla korunan içerik dahil – çoğaltma eğilimidir. İçinde son örneğin, CNET tarafından açıklayıcı makaleler yazmak için kullanılan bir yapay zeka aracının, insanlar tarafından yazılmış intihal makaleleri olduğu bulundu – makaleler muhtemelen eğitim veri setinde tarandı. Bu arada, Aralık ayında yayınlanan bir akademik çalışma, DALL-E 2 ve Stable Difusion gibi görüntü oluşturan yapay zeka modellerinin şunları yapabildiğini ve yapabildiğini buldu: görüntülerin özelliklerini eğitim verilerinden kopyalayın.

Üretken yapay zeka alanı sağlıklı olmaya devam ediyor – Kasım 2022’ye kadar 1,3 milyar dolarlık risk sermayesi topladı. binaen önceki yıla göre %15 artışla PitchBook’a. Ancak yasal sorular işi etkilemeye başlıyor.

Bazı görüntü barındırma platformları, yasal geri tepme korkusuyla yapay zeka tarafından oluşturulan içeriği yasakladı. Ve birkaç hukuk uzmanı, üretken AI araçlarının, araçlar tarafından üretilen telif hakkıyla korunan içeriği sattıkları herhangi bir ürüne istemeden dahil etmeleri durumunda şirketleri riske atabileceği konusunda uyardı.

Açık kaynak yazılım lisanslama konusunda hukuk uzmanı ve OSS Capital’in genel ortağı olan Heather Meeker, TechCrunch’a e-posta yoluyla “Maalesef, neredeyse tüm üretken AI ürünleri için bir dava seli bekliyorum” dedi. “Telif hakkı yasasının açıklığa kavuşturulması gerekiyor.”

Fantastik manzaralar yaratmasıyla tanınan Polonyalı sanatçı Greg Rutkowski gibi içerik yaratıcıları, üretici yapay zeka girişimlerinin sanatçılara yönelik muamelesini protesto eden kampanyaların yüzü haline geldi. Rutkowski, “Kılıçlı Büyücü ve parlayan sihirli ateş küresi, şiddetli bir ejderha Greg Rutkowski ile savaşır” gibi metin yazmanın, orijinal çalışmasına çok benzeyen bir görüntü yaratacağından ve gelirini tehdit edeceğinden şikayet etti.

Üretken yapay zekanın hiçbir yere gitmediği göz önüne alındığında, sırada ne var? Hangi yasal davaların değeri var ve ufukta hangi mahkeme savaşları var?

Nixon Peabody’nin fikri mülkiyet avukatı Eliana Torres, Stability AI, Midjourney ve DeviantArt’a karşı açılan toplu dava iddialarının mahkemede kanıtlanmasının zor olacağını söylüyor. Özellikle, yapay zeka sistemlerini eğitmek için hangi görüntülerin kullanıldığını belirlemenin zor olacağını düşünüyor çünkü sistemlerin ürettiği sanat, eğitim görüntülerinden herhangi birine tam olarak benzemeyebilir.

Stable Diffusion gibi son teknoloji görüntü üreten sistemler, “difüzyon” modelleri olarak bilinen sistemlerdir. Difüzyon modelleri, büyük eğitim veri setlerinde ilerlerken metin komutlarından (örneğin, “pencere pervazına tünemiş bir kuş taslağı”) görüntüler oluşturmayı öğrenir. Modeller, sıfırdan çizmek yerine görüntüleri “yeniden oluşturmak” için eğitildi, saf gürültüyle başlayıp görüntüyü metin istemine adım adım yaklaştıracak şekilde zaman içinde iyileştirdi.

Mükemmel rekreasyonlar Torres’e göre pek sık olmaz. Belirli bir sanatçının stilindeki görüntülere gelince, stilin telif hakkıyla korunmasının neredeyse imkansız olduğu kanıtlanmıştır.

“Tarzına göre” tanımının ‘başkalarının kabul edeceği bir eser’ olarak, o sanatçı tarafından yaratılmış bir eser olarak genel bir kabul elde etmek zor olacak. stil şikayette belirtilen ‘çağrıldı’ [i.e. against Stability AI et al.]Torres, TechCrunch’a bir e-posta röportajında ​​​​söyledi.

Torres ayrıca, davanın bu yapay zeka sistemlerinin yaratıcılarına değil, onları eğitmek için kullanılan görüntüleri derlemekten sorumlu tarafa, yani kar amacı gütmeyen bir kuruluş olan Büyük Ölçekli Yapay Zeka Açık Ağı’na (LAION) yöneltilmesi gerektiğine inanıyor. Midjourney, DeviantArt ve Stability AI, LAION’un web’deki milyarlarca görüntüyü kapsayan veri kümelerinden alınan eğitim verilerini kullanır.

Torres, “LAION veri setini oluşturduysa, iddia edilen ihlal, veri setinin modelleri eğitmek için kullanılmasından sonra değil, o noktada meydana geldi” dedi. “Bir insanın bir galeriye girip resimlere bakabilmesi ama fotoğraf çekmesine izin verilmemesi gibi.”

ChatGPT’nin arkasındaki şirket olan Stability AI ve OpenAI gibi şirketler, sistemlerinin lisanslı içerikle eğitilmesi durumunda “adil kullanımın” onları koruduğunu uzun süredir iddia ediyor. ABD yasalarında yer alan bu doktrin, önce hak sahibinden izin almak zorunda kalmadan telif hakkıyla korunan materyalin sınırlı kullanımına izin verir.

Taraftarlar Authors Guild v. Google gibi davalara işaret ediyor, New York merkezli ABD İkinci Daire Temyiz Mahkemesi’nin, Google’ın kitap arama projesini oluşturmak için telif hakkıyla korunan milyonlarca kitabı lisanssız olarak manuel olarak taramasının adil kullanım olduğuna karar verdiği dava. Adil kullanımın ne olduğu sürekli olarak sorgulanmakta ve gözden geçirilmektedir, ancak üretici yapay zeka alanında bu, özellikle denenmemiş bir teoridir.

son zamanlarda makale Bloomberg Yasası, bir adil kullanım savunmasının başarısının, yapay zeka tarafından üretilen işlerin dikkate alınıp alınmadığına bağlı olacağını iddia ediyor. dönüştürücü — başka bir deyişle, telif hakkıyla korunan çalışmaları orijinallerinden önemli ölçüde farklı bir şekilde kullanıp kullanmadıkları. Önceki içtihat, özellikle Yargıtay’ın 2021 Google – Oracle kararı, toplanan verilerin yeni eserler oluşturmak için kullanılmasının dönüştürücü olabileceğini öne sürüyor. Bu durumda, Google’ın Android işletim sistemini oluşturmak için Java SE kodu bölümlerini kullanması adil kullanım olarak bulundu.

İlginç bir şekilde, diğer ülkeler, telif hakkıyla korunan veya korunmayan, halka açık içeriğin daha izin verici kullanımına yönelik bir hareketin sinyallerini verdiler. Örneğin Birleşik Krallık, güç dengesini hak sahiplerinden uzaklaştırıp büyük ölçüde işletmelere ve diğer ticari kuruluşlara kaydırarak “herhangi bir amaç için” metin ve veri madenciliğine izin verecek şekilde mevcut bir yasayı değiştirmeyi planlıyor. Bununla birlikte, ABD’de böyle bir değişikliği benimseme iştahı yok ve Torres bunun yakın zamanda – eğer olursa – değişmesini beklemiyor.

Getty davası biraz daha nüanslıdır. Getty – hangi Torres notları henüz resmi bir şikayette bulunmadı – hasarları göstermeli ve iddia ettiği herhangi bir ihlali belirli görüntülere bağlamalıdır. Ancak Getty’nin açıklaması, mali zararlarla ilgilenmediğini ve yalnızca “yeni bir yasal statüko” aradığını belirtiyor.

Yapay zeka odaklı hukuk firması BNH.ai’nin kurucularından biri olan Andrew Burt, Torres, fikri mülkiyet konularına odaklanan üretken AI davalarının “nispeten basit” olacağına inandığı ölçüde. Ona göre, yapay zeka sistemlerini eğitmek için telif hakkıyla korunan veriler kullanıldıysa – fikri mülkiyet veya gizlilik kısıtlamaları nedeniyle – bu sistemler para cezalarına veya diğer cezalara tabi olmalıdır ve olacaktır.

Burt, Federal Ticaret Komisyonu’nun (FTC) zaten “dediği şeyle bu yolu izlediğini kaydetti.algoritmik bozulmateknoloji firmalarını, onları eğitmek için kullandıkları kötü niyetli verilerle birlikte sorunlu algoritmaları öldürmeye zorlar. Yakın tarihli bir örnekte FTC, artık feshedilmiş Ever adlı mobil uygulamanın üreticisi Everalbum’u, uygulamasını kullanan kişiler tarafından yüklenen içeriği kullanarak şirketin geliştirdiği yüz tanıma algoritmalarını silmeye zorlamak için algoritmik disgorgement çaresini kullandı. (Everalbum, kullanıcıların verilerinin bu amaçla kullanıldığını açıkça belirtmedi.)

Burt, “Üretken yapay zeka sistemlerinin bu açıdan geleneksel yapay zeka sistemlerinden hiçbir farkı olmamasını beklerdim” dedi.

Emsal ve rehberliğin yokluğunda şirketler ne yapacak? Torres ve Burt, bariz bir yanıt olmadığı konusunda hemfikir.

Torres, kendi payına, her bir ticari üretken yapay zeka sisteminin kullanım koşullarına yakından bakılmasını öneriyor. Midjourney’in ücretli ve ücretsiz kullanıcılar için farklı haklara sahip olduğunu, OpenAI’nin DALL-E’sinin ise kullanıcılara üretilen sanatla ilgili haklar atadığını ve aynı zamanda onları “benzer içerik” konusunda uyardığını ve ihlalden kaçınmak için durum tespiti yapılmasını teşvik ettiğini belirtiyor.

“İşletmeler, kullanım koşullarının farkında olmalı ve ticari olarak kullanılması amaçlanan üretilen çalışmanın ters görüntü aramasını kullanmak gibi durum tespiti yapmalıdır” diye ekledi.

Burt, şirketlerin, AI sistemlerinin tasarımı ve kullanımındaki risklerin nasıl ele alınacağı ve azaltılacağı konusunda rehberlik eden Ulusal Standartlar ve Teknoloji Enstitüsü tarafından yayınlanan AI Risk Management Framework gibi risk yönetimi çerçevelerini benimsemesini önerir. Ayrıca şirketlerin potansiyel yasal yükümlülükler için sistemlerini sürekli olarak test etmelerini ve izlemelerini önermektedir.

Burt, “Üretken yapay zeka sistemleri, yapay zeka risk yönetimini zorlaştırırken – adil olmak gerekirse, riskler için ikili tahminler yapan bir yapay zeka sistemini izlemek çok daha basittir – alınabilecek somut önlemler var” dedi.

Aktivistlerin ve içerik oluşturucuların baskısı altındaki bazı firmalar doğru yönde adımlar attı. Stability AI, sanatçıların yeni nesil Stable Diffusion modelini eğitmek için kullanılan veri kümesini devre dışı bırakmalarına izin vermeyi planlıyor. HaveIBeenTrained.com web sitesi aracılığıyla, hak sahipleri birkaç hafta sonra eğitim başlamadan önce iptal talebinde bulunabilecekler. Rival OpenAI, böyle bir devre dışı bırakma mekanizması sunmuyor, ancak firma, resim galerilerinin bazı kısımlarını lisanslamak için Shutterstock gibi kuruluşlarla ortaklık kurdu.

Copilot için GitHub, kod önerilerini çevreleyen yaklaşık 150 karakterlik kodla birlikte genel GitHub koduna göre kontrol eden ve bir eşleşme veya “yakın eşleşme” varsa önerileri gizleyen bir filtre sundu. Kusursuz bir önlem – filtrenin etkinleştirilmesi, Copilot’un atıf ve lisans metninin önemli parçalarını atlamasına neden olabilir – ancak GitHub, geliştiricilerin Copilot’un önerilerini kullanıp kullanmama konusunda bilinçli kararlar vermelerine yardımcı olmayı amaçlayan ek özellikleri 2023’te sunmayı planladığını söyledi.

On bin fitlik görüşü ele alan Burt, üretici yapay zekanın tehlikelerinin nasıl ele alınacağına dair bir anlayış olmaksızın giderek daha fazla konuşlandırıldığına inanıyor. İçerik oluşturucuları eğitmek için kullanılan telif hakkıyla korunan eserler gibi bariz sorunlarla mücadele etme çabalarını övüyor. Ancak, sistemlerin opaklığının, sistemlerin ortalığı kasıp kavurmasını ve sistemlerin risklerini ortaya çıkmadan önce ele alacak bir plana sahip olmalarını önlemek için işletmeler üzerinde baskı oluşturacağı konusunda uyarıyor.

“Üretken yapay zeka modelleri, yapay zekanın en heyecan verici ve yeni kullanımları arasında yer alıyor – ‘bilgi ekonomisini’ dönüştürmek için açık bir potansiyele sahip” dedi. “Diğer birçok alanda yapay zekada olduğu gibi, teknoloji büyük ölçüde orada ve kullanıma hazır. Henüz olgunlaşmamış olan, tüm risklerini yönetmenin yollarıdır. Bu sistemlerin zararlarının dikkatli ve olgun bir değerlendirmesi ve yönetimi olmadan, bir teknolojiyi zarar vermesini nasıl durduracağımızı anlamadan kullanma riskini alıyoruz.”

Meeker daha kötümser ve tüm işletmelerin – üstlendikleri hafifletme önlemlerine bakılmaksızın – üretken yapay zeka ile ilişkili yasal maliyetleri karşılayamayacağını savunuyor. Bu, telif hakkı yasasında acil açıklama veya değişiklik yapılması gerektiğine işaret ediyor, diyor.

Meeker, “Yapay zeka geliştiricileri, modelleri eğitmek için hangi verileri kullanabileceklerini bilmezlerse, teknoloji yıllarca geride kalabilir” dedi. “Bir bakıma yapabilecekleri hiçbir şey yok, çünkü işletmeler ücretsiz olarak temin edilebilen materyaller üzerinde yasal olarak model eğitemezlerse, modelleri eğitmek için yeterli veriye sahip olmayacaklar. Yalnızca dahil olma veya devre dışı bırakma modelleri veya telif ücretlerini tüm yazarlara ödeme için toplayan sistemler gibi çeşitli uzun vadeli çözümler vardır … Modelleri eğitmek için telif hakkıyla korunan materyalleri almak için AI işletmelerine karşı açılan davalar, sektör için potansiyel olarak felç edicidir. [and] inovasyonu sınırlayacak konsolidasyona neden olabilir.”



genel-24