Jordan Meyer ve Mathew Dryhurst, sanatçıların eserlerinin çevrimiçi olarak nasıl kullanıldığı konusunda daha fazla kontrol sahibi olmalarına yardımcı olacak araçlar oluşturmak için Spawning AI’yi kurdu. Son projeleri Source.Plusyapay zeka modeli eğitimi için “hak ihlalinde bulunmayan” medyayı seçmeyi amaçlamaktadır.

Source.Plus projesinin ilk girişimi, yaklaşık 40 milyon kamuya açık görsel ve görselin yer aldığı bir veri kümesidir. Creative Commons’ın CC0 lisansıBu, yaratıcıların eserlerine ilişkin neredeyse tüm yasal menfaatlerden feragat etmelerine olanak tanır. Meyer, önemli ölçüde daha küçük olmasına rağmen şunu iddia ediyor: diğer bazı üretken yapay zeka eğitim veri kümeleri Source.Plus’ın veri seti zaten son teknoloji ürünü bir görüntü oluşturma modelini eğitmeye yetecek kadar “yüksek kaliteli”.

Meyer, “Source.Plus ile evrensel bir ‘katılım’ platformu oluşturuyoruz” dedi. “Amacımız, hak sahiplerinin medyalarını üretken yapay zeka eğitiminde kullanım için kendi şartlarına göre sunmalarını kolaylaştırmak ve geliştiricilerin bu medyayı eğitim iş akışlarına dahil etmelerini sorunsuz hale getirmek.”

Hak yönetimi

Üretken yapay zeka modellerinin, özellikle de Stable Diffusion ve OpenAI’nin DALL-E 3’ü gibi sanat üreten modellerin eğitiminin etiği etrafındaki tartışma hız kesmeden devam ediyor ve ortalık yatışsa da sanatçılar üzerinde büyük etkileri var.

Üretken yapay zeka modelleri, çok sayıda ilgili veri (bu durumda görüntüler) üzerinde eğitim alarak çıktılarını (örneğin, fotogerçekçi sanat) üretmeyi “öğreniyor”. Bu modellerin bazı geliştiricileri, adil kullanımın, verilerin telif hakkı durumu ne olursa olsun, kamu kaynaklarından veri kaçırma hakkı verdiğini savunuyor. Diğerleri ise içerik sahiplerine eğitim setlerine yaptıkları katkılardan dolayı tazminat ödeyerek veya en azından kredi vererek çizgiyi aşmaya çalıştı.

Spawning’in CEO’su Meyer, henüz kimsenin en iyi yaklaşıma karar vermediğine inanıyor.

TechCrunch’a bir röportajında ​​şunları söyledi: “Yapay zeka eğitimi sıklıkla varsayılan olarak mevcut en kolay verileri kullanmayı tercih ediyor; bu da her zaman en adil veya sorumlu bir şekilde elde edilen veriler olmuyor.” “Sanatçıların ve hak sahiplerinin, verilerinin yapay zeka eğitimi için nasıl kullanıldığı konusunda çok az kontrolü vardı ve geliştiricilerin veri haklarına saygı göstermeyi kolaylaştıracak yüksek kaliteli alternatifleri yoktu.”

Sınırlı beta sürümünde mevcut olan Source.Plus, Spawning’in sanat kaynağı ve kullanım hakları yönetimine yönelik mevcut araçları üzerine kurulmuştur.

2022’de Spawning, içerik oluşturucuların Hugging Face ve Stability AI dahil olmak üzere Spawning ile ortaklık kuran satıcılar tarafından kullanılan eğitim veri kümelerinin dışında kalmalarına olanak tanıyan bir web sitesi olan HaveIBeenTrained’i oluşturdu. True Ventures ve Seed Club Ventures da dahil olmak üzere yatırımcılardan 3 milyon dolarlık risk sermayesi topladıktan sonra Spawning, web sitelerinin yapay zeka için “izinler belirlemesi” için bir yol olan ai.text’i ve veri kazıyan botlara karşı savunma sağlayacak bir sistem olan Kudurru’yu kullanıma sundu. .

Source.Plus, Spawning’in bir medya kütüphanesi oluşturma ve bu kütüphaneyi şirket içinde düzenleme yönündeki ilk çabasıdır. Meyer, ilk görüntü veri kümesi olan PD/CC0’nin ticari veya araştırma uygulamaları için kullanılabileceğini söylüyor.

Yumurtlama Source.Plus
Source.Plus kitaplığı.
Resim Kredisi: Yumurtlama

“Source.Plus yalnızca eğitim verileri için bir depo değil; eğitim akışını destekleyecek araçlara sahip bir zenginleştirme platformudur” diye devam etti. “Hedefimiz, yıl içinde kullanıma sunulacak güçlü bir temel yapay zeka modelini destekleyebilecek, yüksek kaliteli, hak ihlalinde bulunmayan bir CC0 veri kümesine sahip olmaktır.”

Getty Images, Adobe, Shutterstock ve AI startup’ı Bria gibi kuruluşlar, model eğitimi için yalnızca adil kaynaklı verileri kullandıklarını iddia ediyor. (Getty, üretken yapay zeka ürünlerini “ticari açıdan güvenli” olarak adlandıracak kadar ileri gidiyor.) Ancak Meyer, Spawning’in, verileri adil bir şekilde kaynaklamanın ne anlama geldiği konusunda “daha yüksek bir çıta” belirlemeyi hedeflediğini söylüyor.

Source.Plus, görüntüleri “devre dışı bırakma” ve diğer sanatçı eğitimi tercihleri ​​için filtreler ve görüntülerin nasıl ve nereden alındığına ilişkin kaynak bilgilerini gösterir. Ayrıca, CC0 kapsamında lisanslanmayan görseller de dahil değildir. Creative Commons BY 1.0 lisansı, atıf gerektiren. Ve Spawning, Wikimedia Commons gibi bir eserin telif hakkı durumunu belirtmekten yaratıcılardan başka birinin sorumlu olduğu kaynaklardan gelen telif hakkı zorluklarını takip ettiğini söylüyor.

Meyer, “Topladığımız görüntülerin bildirilen lisanslarını titizlikle doğruladık ve şüpheli tüm lisansları hariç tuttuk; bu, birçok ‘adil’ veri kümesinin atmadığı bir adım” dedi.

Tarihsel olarak, şiddet içeren ve pornografik, hassas kişisel görseller de dahil olmak üzere sorunlu görseller, hem açık hem de ticari eğitim veri kümelerini rahatsız etmiştir.

LAION veri kümesinin bakımcıları, raporların ortaya çıkmasından sonra bir kütüphaneyi çevrimdışına almak zorunda kaldı tıbbi kayıtlar Ve çocuk cinsel istismarı tasvirleri; sadece bu hafta, bir çalışmak İnsan Hakları İzleme Örgütü’nden bir araştırma, LAION’un bilgi depolarından birinde Brezilyalı çocukların yüzlerinin, o çocukların rızası veya bilgisi olmadan yer aldığını tespit etti. Başka bir yerde, şirketin sanat üreten Firefly Image modeli de dahil olmak üzere üretken yapay zeka modellerini eğitmek için kullandığı Adobe’nin stok medya kitaplığı Adobe Stock, kullanıma sunuldu. Yapay zeka tarafından oluşturulan görseller içerdiği tespit edildi Midjourney gibi rakiplerden.

Yumurtlama Source.Plus
Source.Plus galerisindeki sanat eseri.
Resim Kredisi: Yumurtlama

Spawning’in çözümü, görüntülerdeki çıplaklık, kan, kişisel bilgileri ve diğer istenmeyen parçaları tespit etmek üzere eğitilmiş sınıflandırıcı modellerdir. Meyer, hiçbir sınıflandırıcının mükemmel olmadığının bilincinde olarak Spawning’in, sınıflandırıcıların tespit eşiklerini ayarlayarak kullanıcıların Source.Plus veri kümesini “esnek bir şekilde” filtrelemesine olanak sağlamayı planladığını söylüyor.

Meyer, “Veri sahipliğini doğrulamak için moderatörler kullanıyoruz” diye ekledi. “Ayrıca, kullanıcıların rahatsız edici veya ihlal oluşturabilecek çalışmaları işaretleyebileceği ve bu verilerin nasıl tüketildiğinin izinin denetlenebileceği yerleşik iyileştirme özelliklerimiz de var.”

Tazminat

İçerik oluşturuculara üretken yapay zeka eğitim verileri katkılarından dolayı tazminat ödemeyi amaçlayan programların çoğu pek de iyi gitmedi. Bazı programlar yaratıcılara ödenecek ödemeleri hesaplamak için şeffaf olmayan ölçümlere güvenirken, diğerleri sanatçıların mantıksız derecede düşük olduğunu düşündüğü miktarları ödüyor.

Örneğin Shutterstock’u ele alalım. Yapay zeka satıcılarıyla on milyonlarca dolarlık anlaşmalar yapan stok medya kütüphanesi, üretken yapay zeka modellerini veya lisanslarını üçüncü taraf geliştiricilere eğitmek için kullandığı sanat eserleri için bir “katkıda bulunanlar fonuna” ödeme yapıyor. Ancak Shutterstock, sanatçıların ne kadar kazanmayı bekleyebilecekleri konusunda şeffaf değildir ve sanatçıların kendi fiyatlarını ve koşullarını belirlemesine de izin vermez; bir üçüncü taraf tahmini, kazancın 2.000 görüntü için 15 ABD doları olduğunu gösteriyor; bu da tam anlamıyla dünyayı sarsacak bir miktar değil.

Source.Plus bu yılın sonlarında betadan çıkıp PD/CC0’ın ötesindeki veri kümelerini de kapsayacak şekilde genişlediğinde, diğer platformlardan farklı bir yol izleyecek ve sanatçıların ve hak sahiplerinin indirme başına kendi fiyatlarını belirlemesine olanak tanıyacak. Meyer, yumurtlamanın bir ücret talep edeceğini, ancak yalnızca sabit bir ücretin – “bir kuruşun onda biri” olduğunu söylüyor.

Müşteriler ayrıca görüntü koleksiyonlarını özel olarak yönetmelerine, veri setini ayda 10.000 defaya kadar indirmelerine ve kazanç elde etmelerine olanak tanıyan bir abonelik planı olan Source.Plus Curation için Spawning’e ayda 10 ABD doları artı tipik görüntü başına indirme ücreti ödemeyi de seçebilirler. “premium” koleksiyonlar ve veri zenginleştirme gibi yeni özelliklere erken erişim.

Yumurtlama Source.Plus
Resim Kredisi: Yumurtlama

Meyer, “Mevcut endüstri standartlarına ve dahili ölçümlere dayalı olarak rehberlik ve öneriler sunacağız, ancak sonuçta veri setine katkıda bulunanlar, onu kendileri için neyin değerli kılacağını belirleyecek” dedi. “Bu fiyatlandırma modelini, sanatçılara gelirden aslan payını vermek ve katılım için kendi koşullarını belirlemelerine olanak tanımak için bilinçli olarak seçtik. Bu gelir paylaşımının, sanatçılar için daha yaygın olan yüzdesel gelir paylaşımından önemli ölçüde daha avantajlı olduğuna ve daha yüksek ödemeler ve daha fazla şeffaflığa yol açacağına inanıyoruz.”

Source.Plus, Spawning’in umduğu ilgiyi kazanırsa, Spawning bunu görüntülerin ötesinde, ses ve video da dahil olmak üzere diğer medya türlerine de genişletmeyi planlıyor. Spawning, verilerini Source.Plus’ta sunmak için isimsiz firmalarla görüşmelerde bulunuyor. Meyer, Spawning’in Source.Plus veri kümelerinden elde edilen verileri kullanarak kendi üretken yapay zeka modellerini oluşturabileceğini söylüyor.

Meyer, “Üretken yapay zeka ekonomisine katılmak isteyen hak sahiplerinin bunu yapma ve adil tazminat alma fırsatına sahip olacağını umuyoruz” dedi. “Ayrıca yapay zekayla etkileşime girme konusunda çelişki yaşayan sanatçıların ve geliştiricilerin bunu diğer yaratıcılara saygılı bir şekilde yapma fırsatına sahip olacaklarını umuyoruz.”

Elbette Spawning’in burada ortaya çıkaracağı bir yer var. Source.Plus, sanatçıları üretken yapay zeka geliştirme sürecine dahil etme ve çalışmalarından elde edilen karı paylaşmalarına olanak sağlama konusunda en umut verici girişimlerden biri gibi görünüyor.

Meslektaşım Amanda Silberling’in yakın zamanda yazdığı gibi, Meta’nın üretken yapay zekasını sanatçı içeriği de dahil olmak üzere Instagram’daki içerikler üzerinde eğitebileceğini duyurmasının ardından kullanımda artış gören sanat barındırma topluluğu Cara gibi uygulamaların ortaya çıkışı, yaratıcı topluluğun bu seviyeye ulaştığını gösteriyor. bir kırılma noktası. Hırsız olarak gördükleri şirket ve platformlara alternatif bulma konusunda çaresizler ve Source.Plus da geçerli bir alternatif olabilir.

Ancak Spawning her zaman sanatçıların çıkarlarına en uygun şekilde hareket ediyorsa (Spawning’in VC destekli bir iş olduğu düşünülürse bu büyük bir ihtimal), Source.Plus’ın Meyer’in öngördüğü kadar başarılı bir şekilde büyüyüp büyüyemeyeceğini merak ediyorum. Sosyal medya bize bir şey öğrettiyse o da, özellikle kullanıcı tarafından oluşturulan milyonlarca içerik parçasının denetlenmesinin zorlu bir sorun olduğudur.

Yakında öğreneceğiz.



genel-24