OpenAI, video üreten yapay zekası Sora’yı eğitmek için tam olarak hangi verileri kullandığını hiçbir zaman açıklamadı. Ancak görünüşe bakılırsa verilerin en azından bir kısmı Twitch yayınlarından ve oyunların izlenecek yollarından gelmiş olabilir.
Sora Pazartesi günü piyasaya sürüldü ve bir süredir (kapasite sorunlarının izin verdiği ölçüde) üzerinde çalışıyorum. Sora, bir metin isteminden veya görselden çeşitli en boy oranlarında ve çözünürlüklerde 20 saniyeye kadar uzunlukta videolar oluşturabilir.
OpenAI, Şubat ayında Sora’yı ilk kez ortaya çıkardığında modeli Minecraft videoları üzerinde eğittiğinden bahsetmişti. Peki, eğitim setinde başka hangi video oyunu oynanışlarının gizlendiğini merak ettim.
Görünüşe göre epeyce var.
Sora, aslında bir Super Mario Bros. klonunun (eğer hatalıysa) bir videosunu oluşturabilir:

Call of Duty ve Counter-Strike’dan ilham alan bir birinci şahıs nişancı oyununun oynanış görüntülerini oluşturabilir:

Ve 90’ların Teenage Mutant Ninja Turtle oyunu tarzında bir arcade dövüşçüsünü gösteren bir klip de yayınlayabilir:

Sora ayrıca bir Twitch yayınının nasıl görünmesi gerektiği konusunda da bilgi sahibi gibi görünüyor; bu da yayının birkaç kez görüldüğünü ima ediyor. Geniş vuruşları doğru yapan aşağıdaki ekran görüntüsüne göz atın:

Ekran görüntüsünde dikkate değer bir diğer şey: Auronplay adıyla anılan popüler Twitch yayıncısı Raúl Álvarez Genes’in, Genes’in sol ön kolundaki dövmeye kadar benzerliğini içeriyor.
Auronplay, Sora’nın “bildiği” tek Twitch yayıncısı değil. Görünüş olarak (bazı sanatsal özgürlüklerle birlikte) daha çok Pokimane olarak bilinen Imane Anys’e benzeyen bir karakterin videosunu oluşturdu.

Kabul ediyorum, bazı yönlendirmelerde yaratıcı olmam gerekiyordu (örneğin “İtalyan tesisatçı oyunu”). OpenAI, Sora’nın ticari markalı karakterleri gösteren klipler oluşturmasını engellemek için filtreleme uyguladı. Örneğin “Mortal Kombat 1 oynanışı” gibi bir şey yazmak, başlığa benzer bir şey vermez.
Ancak testlerim oyun içeriğinin Sora’nın eğitim verilerine girmiş olabileceğini gösteriyor.
OpenAI, eğitim verilerini nereden alacağı konusunda temkinli davrandı. bir röportaj Mart ayında The Wall Street Journal ile ilgili bir açıklama yapan OpenAI’nin o zamanki CTO’su Mira Murati, Sora’nın YouTube, Instagram ve Facebook içeriği üzerine eğitim aldığını açıkça inkar etmedi. Ve teknik özellikler Sora adına OpenAI, Sora’yı geliştirmek için “kamuya açık” verilerin yanı sıra Shutterstock gibi hazır medya kitaplıklarından alınan lisanslı verileri kullandığını kabul etti.
OpenAI ayrıca yorum talebine yanıt vermedi.
Oyun içeriği gerçekten Sora’nın eğitim setinde yer alıyorsa, bunun yasal sonuçları olabilir; özellikle de OpenAI, Sora’nın üzerine daha etkileşimli deneyimler oluşturursa.
Pryor Cashman’ın fikri mülkiyet avukatı Joshua Weigensberg, TechCrunch’a şunları söyledi: “Video oyunlarının lisanssız görüntüleri üzerinde eğitim alan şirketler birçok riskle karşı karşıyadır.” “Üretken bir yapay zeka modelinin eğitimi genellikle eğitim verilerinin kopyalanmasını içerir. Eğer bu veriler oyunların video gösterimleriyse, büyük olasılıkla telif hakkıyla korunan materyallerin eğitim setine dahil edilmesi muhtemeldir.”
Olasılıksal modeller
Sora gibi üretken yapay zeka modelleri olasılıksaldır. Pek çok veri üzerinde eğitim almışlar ve tahminlerde bulunmak için bu verilerdeki kalıpları öğreniyorlar; örneğin, hamburgeri ısıran bir kişinin ısırık izi bırakacağı gibi.
Bu kullanışlı bir özelliktir. Modellerin bir dereceye kadar dünyanın nasıl çalıştığını gözlemleyerek “öğrenmelerini” sağlar. Ama aynı zamanda Aşil’in topuğu da olabilir. Belirli bir şekilde istendiğinde, çoğu genel web verileriyle eğitilen modeller, eğitim örneklerinin neredeyse kopyalarını üretir.

Bu durum, çalışmaları izinleri olmadan eğitim sırasında ele geçirilen yaratıcıları anlaşılır bir şekilde rahatsız etti. Giderek artan sayıda kişi, mahkeme sistemi aracılığıyla çare arıyor.
Microsoft ve OpenAI şu anda dava açıldı Yapay zeka araçlarının lisanslı kodu yeniden oluşturmasına izin verdiği iddia ediliyor. Popüler AI sanat uygulamalarının arkasındaki üç şirket, Midjourney, Runway ve Stability AI, kendilerini sanatçıların haklarını ihlal etmekle suçlayan bir davanın hedefinde. Ve büyük müzik şirketleri, yapay zeka destekli şarkı üreteçleri geliştiren iki girişim olan Udio ve Suno’ya ihlal nedeniyle dava açtı.
Birçok yapay zeka şirketi, modellerinin intihal değil dönüştürücü çalışmalar yarattığını ileri sürerek uzun süredir adil kullanım koruması talep ediyor. Örneğin Suno, ayrım gözetmeyen eğitimin “bir çocuğun türü dinledikten sonra kendi rock şarkılarını yazmasından” farklı olmadığını öne sürüyor.
Ancak Dorsey & Whitney’de telif hakkı hukuku konusunda uzmanlaşmış bir avukat olan Evan Everist, oyun içeriğiyle ilgili bazı benzersiz hususların bulunduğunu söylüyor.
Everist, TechCrunch’a bir e-postada şunları söyledi: “Oynama videoları en az iki telif hakkı koruması katmanı içeriyor: oyun geliştiricisine ait olan oyunun içeriği ve oyuncunun deneyimini yakalayan oyuncu veya kameraman tarafından oluşturulan benzersiz video.” “Ve bazı oyunlar için, yazılımda görünen, kullanıcı tarafından oluşturulan içerik biçiminde potansiyel bir üçüncü hak katmanı var.”
Everist, oyuncuların kendi oyun haritalarını oluşturmalarına ve bunları başkalarının kullanması için paylaşmalarına olanak tanıyan Epic’in Fortnite’ını örnek verdi. Bu haritalardan birinin oynanışını gösteren bir videonun en az üç telif hakkı sahibini ilgilendireceğini söyledi: (1) Epic, (2) haritayı kullanan kişi ve (3) haritanın yaratıcısı.

Everist, “Mahkemeler yapay zeka modellerinin eğitimi için telif hakkı sorumluluğu bulursa, bu telif hakkı sahiplerinin her biri potansiyel davacı veya lisans kaynağı olacaktır” dedi. “Bu tür videolarda yapay zekayı eğiten geliştiriciler için riske maruz kalma katlanarak artıyor.”
Weigensberg, oyunların kendilerinin, hakimin fikri mülkiyet davasında dikkate alabileceği, tescilli dokular gibi pek çok “korunabilir” öğeye sahip olduğunu belirtti. “Bu çalışmalar uygun şekilde lisanslanmadığı sürece” dedi, “bunlarla ilgili eğitim ihlalde bulunabilir.”
TechCrunch, yorum almak için aralarında Epic, Microsoft (Minecraft’ın sahibi), Ubisoft, Nintendo, Roblox ve Cyberpunk geliştiricisi CD Projekt Red’in de bulunduğu çok sayıda oyun stüdyosu ve yayıncıya ulaştı. Çok az kişi yanıt verdi ve hiçbiri kayıtlara geçen bir açıklama yapmadı.
CD Projekt Red’in bir sözcüsü, “Şu anda bir röportaja katılamayacağız” dedi. EA, TechCrunch’a “şu anda herhangi bir yorumu olmadığını” söyledi.
Riskli çıktılar
Yapay zeka şirketlerinin bu hukuki anlaşmazlıklarda galip gelmesi mümkün. Mahkemeler, yaklaşık on yıl önce yayıncılık sektörünün Google’a karşı açtığı davada ortaya çıkan emsalin ardından, üretken yapay zekanın “son derece ikna edici bir dönüştürücü amacı” olduğuna karar verebilir.
Bu davada bir mahkeme, Google’ın milyonlarca kitabı bir tür dijital arşiv olan Google Kitaplar için kopyalamasına izin verildiğine karar verdi. Yazarlar ve yayıncılar, fikri mülkiyetlerinin çevrimiçi olarak çoğaltılmasının ihlal anlamına geldiğini iddia etmeye çalışmışlardı.
Ancak yapay zeka şirketleri lehine verilecek bir karar, kullanıcıları yanlış davranış suçlamalarından mutlaka korumayacaktır. Üretken bir model, telif hakkıyla korunan bir çalışmayı yeniden ortaya çıkarırsa, daha sonra gidip bu çalışmayı yayınlayan veya onu başka bir projeye dahil eden kişi yine de fikri mülkiyet ihlalinden sorumlu tutulabilir.
Weigensberg, “Üretken yapay zeka sistemleri genellikle tanınabilir, korunabilir fikri mülkiyet varlıklarını çıktı olarak ortaya koyuyor” dedi. “Metin veya statik görüntüler oluşturan daha basit sistemler, çıktılarında telif hakkıyla korunan materyalin oluşturulmasını önlemede sıklıkla sorun yaşar ve dolayısıyla daha karmaşık sistemler, programcıların niyeti ne olursa olsun aynı sorunu yaşayabilir.”

Bazı AI şirketlerinin, ortaya çıkması durumunda bu durumları kapsayacak tazminat hükümleri vardır. Ancak cümlelerde sıklıkla süslemeler bulunur. Örneğin, OpenAI’ler bireysel kullanıcılar için değil, yalnızca kurumsal müşteriler için geçerlidir.
Weigensberg, telif hakkının yanı sıra ticari marka haklarının ihlali gibi dikkate alınması gereken risklerin de bulunduğunu söylüyor.
“Çıktı aynı zamanda pazarlama ve markalama ile bağlantılı olarak kullanılan, oyunlardan tanınabilir karakterler de dahil olmak üzere ticari marka riski oluşturan varlıkları da içerebilir” dedi. “Ya da çıktı isim, imaj ve benzerlik hakları açısından risk oluşturabilir.”
Dünya modellerine artan ilgi, tüm bunları daha da karmaşık hale getirebilir. OpenAI’nin Sora olarak değerlendirdiği dünya modellerinin bir uygulaması, esasen gerçek zamanlı video oyunları üretmektir. Bu “sentetik” oyunlar modelin eğitim aldığı içeriğe benziyorsa bu durum yasal açıdan sorunlu olabilir.
McKool fikri mülkiyet dava avukatı Avery Williams, “Bir yapay zeka platformunu bir video oyunundaki sesler, hareketler, karakterler, şarkılar, diyaloglar ve sanat eserleri konusunda eğitmek, tıpkı bu unsurların başka bağlamlarda kullanılması durumunda olacağı gibi, telif hakkı ihlali teşkil eder” dedi. Smith dedi. “Üretken yapay zeka şirketlerine karşı açılan pek çok davada ortaya çıkan adil kullanımla ilgili sorular, diğer yaratıcı pazarlar kadar video oyun endüstrisini de etkileyecek.”

