Viggle AI’yı bilmiyor olabilirsiniz, ancak muhtemelen yarattığı viral memleri görmüşsünüzdür. Kanadalı AI girişimi, bir yaz müzik festivalinde sahnede zıplayan rapçi Lil Yachty’nin remikslendiği düzinelerce videodan sorumludur. Bir videoda, Lil Yachty’nin yerine Joaquin’in Phoenix’i JokerBaşka bir yerde, İsa kalabalığı coşturmaya çalışıyor gibiydi. Kullanıcılar bu videonun sayısız versiyonunu yaptı, ancak bir AI girişimi memleri körüklüyordu. Ve Viggle’ın CEO’su YouTube videolarının AI modellerini körüklediğini söylüyor.

Viggle, şirketin basın bülteninde iddia ettiği gibi, “fizik konusunda gerçek bir anlayışa” sahip olmak için 3D video temel modeli JST-1’i eğitti. Viggle CEO’su Hang Chu, Viggle ile diğer AI video modelleri arasındaki temel farkın, Viggle’ın kullanıcıların karakterlerin üstlenmesini istedikleri hareketi belirlemelerine izin vermesi olduğunu söylüyor. Diğer AI video modelleri genellikle fizik yasalarına uymayan gerçekçi olmayan karakter hareketleri yaratır, ancak Chu, Viggle’ın modellerinin farklı olduğunu iddia ediyor.

Chu bir röportajında, “Esasında yeni bir tür grafik motoru oluşturuyoruz, ancak tamamen sinir ağlarıyla,” dedi. “Model, esas olarak piksel tabanlı olan ve fiziğin yapısını ve özelliklerini gerçekten anlamayan mevcut video oluşturucularından oldukça farklı. Modelimiz böyle bir anlayışa sahip olacak şekilde tasarlandı ve bu nedenle kontrol edilebilirlik ve üretim verimliliği açısından önemli ölçüde daha iyi oldu.”

Örneğin, Joker’in Lil Yachty olarak videosunu oluşturmak için, orijinal videoyu (Lil Yachty sahnede dans ediyor) ve o hareketi üstlenecek karakterin (Joker) bir görüntüsünü yüklemeniz yeterlidir. Alternatif olarak, kullanıcılar karakterlerin görüntülerini, onları nasıl canlandıracaklarına dair talimatlarla birlikte metin istemleriyle birlikte yükleyebilirler. Üçüncü bir seçenek olarak, Viggle kullanıcıların yalnızca metin istemleriyle sıfırdan animasyonlu karakterler yaratmalarına olanak tanır.

Ancak memler Viggle kullanıcılarının yalnızca küçük bir yüzdesini oluşturuyor; Chu, modelin yaratıcılar için bir görselleştirme aracı olarak yaygın bir şekilde benimsendiğini söylüyor. Videolar mükemmel olmaktan uzak – titrek ve yüzler ifadesiz – ancak Chu, film yapımcıları, animatörler ve video oyunu tasarımcılarının fikirlerini görsel bir şeye dönüştürmeleri için etkili olduğunu kanıtladığını söylüyor. Şu anda, Viggle’ın modelleri yalnızca karakterler yaratıyor, ancak Chu daha sonra daha karmaşık videolara olanak sağlamayı umuyor.

Viggle şu anda Discord ve web uygulamasında AI modelinin ücretsiz ve sınırlı bir sürümünü sunuyor. Şirket ayrıca artırılmış kapasite için 9,99$ abonelik sunuyor ve bazı içerik oluşturuculara bir içerik oluşturucu programı aracılığıyla özel erişim sağlıyor. CEO, Viggle’ın teknolojiyi lisanslamak için film ve video oyunu stüdyolarıyla görüştüğünü ancak bağımsız animatörler ve içerik oluşturucuları arasında da benimsenme gördüğünü söylüyor.

Pazartesi günü Viggle, Two Small Fish’in katılımıyla Andreessen Horowitz liderliğinde 19 milyon dolarlık bir A serisi fon topladığını duyurdu. Girişim, bu turun Viggle’ın ölçeklenmesine, ürün geliştirmeyi hızlandırmasına ve ekibini genişletmesine yardımcı olacağını söylüyor. Viggle, TechCrunch’a AI modellerini eğitmek ve çalıştırmak için diğer bulut sağlayıcılarının yanı sıra Google Cloud ile ortaklık kurduğunu söylüyor. Bu Google Cloud ortaklıkları genellikle GPU ve TPU kümelerine erişimi içerir, ancak genellikle AI modellerini eğitmek için YouTube videolarını içermez.

Eğitim verileri

TechCrunch’ın Chu ile yaptığı röportajda, Viggle’ın yapay zeka video modellerinin hangi verilerle eğitildiğini sorduk.

Chu, “Şimdiye kadar kamuya açık olan verilere güvendik” dedi ve benzer bir cümleyi şu şekilde aktardı: OpenAI’nin CTO’su Mira Murati, Sora’nın eğitim verileri hakkında yanıt verdi.

Viggle’ın eğitim veri setinde YouTube videolarının yer alıp almadığı sorulduğunda Chu net bir şekilde “Evet” yanıtını verdi.

Bu bir sorun olabilir. Nisan ayında, YouTube CEO’su Neal Mohan, Bloomberg’e, bir AI metin-video oluşturucuyu eğitmek için YouTube videolarını kullanmanın bir “açık ihlal” platformun hizmet şartlarının. Yorumlar OpenAI’nin Sora’yı eğitmek için YouTube videolarını kullanmış olma olasılığı bağlamındaydı.

Mohan, YouTube’un sahibi olan Google’ın, videolarını Google DeepMind’ın Gemini’si için eğitim veri kümelerinde kullanmak üzere belirli içerik oluşturucularla sözleşmeleri olabileceğini açıkladı. Ancak, Mohan ve YouTube’un hizmet şartlarıŞirketin önceden izni alınmaksızın.

TechCrunch’ın Viggle CEO’suyla yaptığı röportajdan sonra, Viggle’ın bir sözcüsü, Chu’nun ifadesinden geri adım atmak için e-posta gönderdi ve TechCrunch’a CEO’nun “Viggle’ın YouTube verilerini eğitim olarak kullanıp kullanmadığı konusunda çok erken konuştuğunu” söyledi. Gerçekte, Hang/Viggle eğitim verilerinin ayrıntılarını paylaşamıyor.

Ancak Chu’nun bunu zaten kayıt altına aldığını belirttik ve konuyla ilgili net bir açıklama istedik. Viggle’ın sözcüsü, yanıtında AI girişiminin YouTube videolarında eğitim aldığını doğruladı:

Viggle, yapay zeka içeriği oluşturmak için YouTube dahil olmak üzere çeşitli kamusal kaynaklardan yararlanır. Eğitim verilerimiz, süreç boyunca tüm hizmet şartlarına uyum sağlanarak dikkatlice düzenlenmiş ve rafine edilmiştir. YouTube gibi platformlarla güçlü ilişkiler sürdürmeyi önceliklendiriyoruz ve büyük miktarda indirme ve yetkisiz video indirmelerini içeren diğer eylemlerden kaçınarak şartlarına saygı göstermeye kararlıyız.

Uyumluluğa yönelik bu yaklaşım, Mohan’ın Nisan ayında YouTube’un video korpusunun kamuya açık bir kaynak olmadığı yönündeki yorumlarıyla çelişiyor gibi görünüyor. YouTube ve Google sözcülerine ulaştık ancak henüz geri dönüş alamadık.

Girişim, YouTube’u eğitim verisi olarak kullanma konusunda gri alanda diğerlerine katılıyor. OpenAI, Nvidia, Apple ve Anthropic dahil olmak üzere birçok AI modeli geliştiricisinin hepsi eğitim için YouTube video transkripsiyonlarını veya kliplerini kullanıyor. Silikon Vadisi’ndeki o kadar da gizli olmayan kirli sır: muhtemelen herkes bunu yapıyor. Aslında nadir olan şey bunu yüksek sesle söylemek.



genel-24