“Avengers”ın yönetmeni Joe Russo gibi ben de tamamen yapay zeka tarafından üretilen filmlerin ve TV şovlarının yaşamımız boyunca mümkün olacağına giderek daha fazla ikna oluyorum.
Son birkaç ayda yapılan bir dizi yapay zeka, özellikle de OpenAI’nin son derece gerçekçi ses veren metinden konuşmaya motoru, bu cesur yeni sınıra kısa bir bakış attı. Ama Meta’nın duyuru bugün, yapay zeka tarafından oluşturulan içerik geleceğimizi özellikle keskin bir şekilde rahatlattı – en azından benim için.
Meta, sabah saatlerinde teknoloji devinin görüntü oluşturma aracı Emu’nun geliştirilmiş hali olan Emu Video’yu piyasaya sürdü. Bir başlık (örneğin “Çimenlik bir tepenin üzerinde koşan bir köpek”), resim veya bir açıklamayla eşleştirilen bir fotoğraf verildiğinde, Emu Video dört saniye uzunluğunda bir animasyonlu klip oluşturabiliyor.
Artık video oluşturma teknolojisi yeni değil. Google’ın yaptığı gibi Meta da bunu daha önce denemişti. Bu arada Runway gibi yeni girişimler zaten bunun üzerinde iş kurmaya başlıyor.
Ancak Emu Video’nun klipleri aslına uygunluk açısından gördüğüm en iyiler arasında yer alıyor; o kadar ki, eğitimsiz gözüm onları gerçek olandan ayırmakta zorlanıyor.
En azından bazıları. Görünüşe göre Emu Video, fotogerçekçilikten sapan basit, çoğunlukla statik sahneleri (örn. şelaleler ve şehir silüetlerinin zaman aralıkları) canlandırmada en başarılısı; yani kübizm, anime, “kağıt kesme sanatı” ve steampunk gibi tarzlarda. Eyfel Kulesi’nin şafak vaktindeki “bir tablo gibi” bir klibi, kulenin altındaki Seine Nehri’ne yansıdığı, bana internette görebileceğiniz bir e-kartı hatırlattı. Amerikan Selamları.
Bununla birlikte, Emu Video’nun en iyi çalışmasında bile yapay zekanın yarattığı tuhaflık, tuhaf fizik (örneğin, yere paralel hareket eden kaykaylar) ve garip eklentiler (ayakların arkasında kıvrılan ayak parmakları ve birbirine karışan bacaklar) gibi, içeri sızmayı başarıyor. Yukarıda bahsedilen Eyfel Kulesi klibindeki kuşlar gibi, nesneler sıklıkla çok fazla mantıksız bir şekilde görünüp kayboluyor.
Emu Video’nun eserlerine (ya da en azından Meta’nın özenle seçtiği örneklere) göz atarak çok fazla zaman harcadıktan sonra, başka bir bariz ipucunu fark etmeye başladım: kliplerdeki konular… pekala, Yapmak fazla. Anlayabildiğim kadarıyla Emu Video’nun eylem fiilleri konusunda güçlü bir kavrayışı yok gibi görünüyor, belki de modelin temel mimarisinin bir sınırlaması.
Örneğin, bir Emu Video klibindeki sevimli, insanbiçimli bir rakun bir gitar tutacaktır, ancak gitarı tutamayacaktır. tıngırdamak gitar – klibin başlığında “tıngırdatma” kelimesi bulunsa bile. Veya iki tek boynuzlu at satranç “oynayacak”, ancak bu sadece taşları hareket ettirmeden satranç tahtasının önüne meraklı bir şekilde oturmaları anlamında.
Yani açıkça yapılması gereken işler var. Yine de Emu Video’nun daha basit b-roll’ü Bugün bir filmde veya TV şovunda yersiz olmayacağını söyleyebilirim – ve bunun etik sonuçları açıkçası beni korkutuyor.
Deepfake riski bir yana, geçim kaynakları Emu Video gibi yapay zekanın artık yaklaşabileceği türde sahneler oluşturmaya bağlı olan animatörler ve sanatçılardan korkuyorum. Meta ve onun üretken AI rakipleri muhtemelen Meta CEO’su Mark Zuckerberg’in Emu Video’yu tartışacağını iddia edeceklerdir. diyor Facebook ve Instagram’a entegre ediliyor, artırmak ziyade yer değiştirmek insan sanatçılar. Ancak bunun samimiyetsiz olmasa da iyimser bir bakış açısı olduğunu söyleyebilirim – özellikle de işin içine para girdiğinde.
Bu yılın başlarında Netflix, üç dakikalık kısa animasyonda yapay zeka tarafından oluşturulan arka plan resimlerini kullandı. Şirket talep edildi Teknolojinin animenin sözde işgücü sıkıntısına yardımcı olabileceği söylendi – ancak düşük ücretlerin ve çoğu zaman yorucu çalışma koşullarının sanatçıları işten ne kadar uzaklaştırdığı rahatlıkla örtbas edildi.
Benzer bir tartışmada, Marvel’ın “Secret Invasion” jenerik sekansının arkasındaki stüdyo, sekansın çizimlerinin çoğunu oluşturmak için yapay zekayı, özellikle de metinden resme aracı Midjourney’i kullandığını itiraf etti. Dizi yönetmeni Ali Selim, yapay zeka kullanımının dizinin paranoyak temalarına uyduğunu ancak sanatçı camiasının ve hayranlarının büyük kısmının şiddetle karşı çıktım.
Aktörler de doğrama bloğunda olabilir. Son SAG-AFTRA grevindeki en önemli anlaşmazlık noktalarından biri, dijital benzerlikler oluşturmak için yapay zekanın kullanılmasıydı. Stüdyolar sonunda oyunculara yapay zeka tarafından oluşturulan benzerlikler için ödeme yapmayı kabul etti. Ancak teknoloji geliştikçe yeniden düşünebilirler mi? Bunun muhtemel olduğunu düşünüyorum.
Yaralanmanın üstüne hakaret ekleyen Emu Video gibi yapay zeka, genellikle sanatçılar, fotoğrafçılar ve film yapımcıları tarafından üretilen görüntüler ve videolar üzerinde eğitilir ve bu yaratıcılara bildirimde bulunulmaz veya tazminat ödenmez. İçinde Beyaz kağıt Emu Video’nun piyasaya sürülmesiyle birlikte Meta, yalnızca modelin uzunlukları 5 ila 60 saniye arasında değişen 34 milyon “video-metin çifti” veri seti üzerinde eğitildiğini söylüyor; bu videoların nereden geldiği, telif hakkı durumları veya Meta’nın olup olmadığı değil. onlara lisans verdi.
Sanatçıların eğitimden “vazgeçmelerine” veya katkıda bulundukları yapay zeka tarafından oluşturulan çalışmalar için ödeme almalarına olanak tanıyan endüstri çapında standartlara yönelik uyum ve başlangıçlar oldu. Ancak Emu Video bir gösterge olarak kabul edilirse, teknoloji – çoğu zaman olduğu gibi – yakında etiğin çok ilerisinde olacak. Belki de zaten vardır.