Meta’nın yapay zeka yolculuğu kaçınılmaz olarak onu yeni gelişen yapay zeka video dünyasına götürecektir. Şimdi, Mark Zuckerberg liderliğindeki şirket, Film Genkısa bir metin isteminden gerçekçi videolar oluşturabilen başka bir video oluşturucu. Meta, bunun Meta dışındaki hiç kimse için mevcut olmasa da, ortalama bir Instagram kullanıcısı için olduğu kadar Hollywood için de yararlı olduğunu iddia ediyor. Movie Gen ses oluşturabilir, böylece şimdiye kadar gördüğümüz en yetenekli derin sahte jeneratör.
bir blog yazısıMeta, su altında yüzen, bir şekilde yüzeyin hemen altında yüzen ve görünüşe göre nefesini tutmakta hiçbir sorun yaşamayan mutlu bir yavru su aygırı da dahil olmak üzere birkaç örnek video gösterdi. Diğer videolar, dönemi temsil edemeyecek kadar kısa kollu ve etekli, “Viktorya dönemi” kıyafetleri giymiş penguenleri gösteriyor. Başka bir videoda, dikkati ritimden dolayı mevcut tehlikesini umursamayacak kadar dağılmış bir çitanın yanında DJ’lik yapan bir kadın var.
Herkes yapay zeka tarafından oluşturulan video alanına giriyor. Bu yıl zaten Microsoft’un VASA-1’i ve OpenAI’nin Sora’sı, basit metin istemlerinden oluşturulan “gerçekçi” videolar vaat ediyordu. Şubat ayında alay konusu olmasına rağmen Sora henüz gün ışığını göremedi. Meta’nın Movie Gen’i, mevcut videoyu bir metin istemiyle düzenlemek, bir görüntüye dayalı video oluşturmak ve oluşturulan videoya yapay zeka tarafından oluşturulan ses eklemek dahil olmak üzere rakiplerinden birkaç özellik daha sunuyor.
Video düzenleme paketi özellikle yeni görünüyor. Oluşturulan videoların yanı sıra gerçek dünyadaki çekimler üzerinde de çalışır. Meta, modelinin “orijinal içeriği koruduğunu” ve çekime sahnenin ana karakterleri için arka plan veya kıyafet gibi öğeler eklediğini iddia ediyor. Meta, insanların fotoğraflarını nasıl çekip oluşturulan filmlere bırakabileceğinizi de gösterdi.
Meta’nın halihazırda müzik ve ses üretme modelleri var, ancak sosyal medya devi, videoların üzerine ses efektleri ve film müzikleri ekleyen 13B parametreli ses oluşturucunun birkaç örneğini sergiledi. Metin girişi, orman zemini boyunca kıvrılan bir yılanın oluşturulan videosuna eklenecek “yaprakların hışırdaması ve dalların çıtırdaması” kadar basit olabilir. Ses oluşturucu şu anda 45 saniyeyle sınırlıdır, bu nedenle tüm filmlerin puanını almaz. En azından henüz olmayacak.
Ve hayır, üzgünüm, henüz kullanamazsınız. Meta’nın baş ürün sorumlusu Chris Cox, Threads’de şöyle yazdı: “Bunu yakın zamanda bir ürün olarak piyasaya sürmeye hazır değiliz; hâlâ pahalı ve oluşturma süresi çok uzun.”
onun içinde teknik inceleme Movie Gen’i tartışan Meta, tüm yazılım paketinin birden fazla temel modelden oluştuğunu söyledi. Şirketin sahip olduğu en büyük video modeli, maksimum bağlam uzunluğu 73.000 video token olan 30B parametreli transformatör modelidir. Ses oluşturucu, hem videodan sese hem de metinden sese işlem yapabilen bir 13B parametre temel modelidir.
Bunu, özellikle OpenAI’den bu yana, en büyük yapay zeka şirketlerinin video oluşturucularıyla karşılaştırmak zor. iddialar Sora, “her biri GPT’deki bir jetona benzeyen yamalar adı verilen verileri” kullanıyor. Meta, yeni yapay zeka araçlarıyla hâlâ veri yayınlayan az sayıdaki büyük şirketten biri; yapay zeka aşırı derecede ticarileştikçe bu uygulama rafa kaldırıldı. Buna rağmen Meta’nın teknik incelemesi, Movie Gen için eğitim verilerini nereden aldığına dair pek bir fikir sunmuyor. Büyük olasılıkla, veri setinin bir kısmı Facebook kullanıcılarının videolarından geldi. Meta, yapay zeka modellerini eğitmek için Meta Ray-Ban akıllı gözlükleriyle çektiğiniz fotoğrafları da kullanıyor.
Henüz Movie Gen’i kullanamazsınız. Bunun yerine, diğer AI film oluşturucuları RunwayML’in 3. Nesil Ödemeye başlamadan önce küçük klipler oluşturmak için sınırlı sayıda jeton sunun. Tarafından hazırlanan bir rapor 404 Medya Bu yılın başlarında Runway’in yapay zekasını binlerce YouTube videosundan eğittiğini ve çoğu yapay zeka girişimi gibi, bu içeriği çıkarmadan önce asla izin istemediğini belirtmişti.
Meta, bu modeli oluştururken film yapımcıları ve video yapımcılarıyla yakın işbirliği içerisinde çalıştığını ve Movie Gen. üzerinde çalışırken de bunu yapmaya devam edeceğini söyledi. Bu yılın başlarındaki raporlar, stüdyoların zaten yapay zeka şirketlerine yakınlaştığını gösteriyor. Bağımsız sevgilim A24 son zamanlarda VC firmalarıyla çalıştı Bazıları OpenAI’ye bağlı olarak yapay zeka konusunda uzmanlaşıyor. Diğer taraftan, Meta bildirildiğine göre Judi Dench ve Awkwafina gibi Hollywood yıldızlarıyla seslerini gelecekteki yapay zeka projelerinde kullanma konusunda görüşmelerde bulunuyor.