Yapay zeka destekli video yapımcısı Runway, birkaç hafta önce piyasaya sürülen Gen-3 modeline söz verilen görüntü-video özelliğini ekledi ve söz verildiği kadar etkileyici olabilir. Runway, geçen yılın başlarında piyasaya sürülen Gen-2 modelindeki en büyük sınırlamalarını ele almak için özelliği geliştirdi. Geliştirilen araç, karakter tutarlılığı ve hiper gerçekçilik konusunda çok daha iyi ve bu da onu yüksek kaliteli video içeriği üretmek isteyen yaratıcılar için daha güçlü bir araç haline getiriyor.
Runway’in Gen-3 modeli hala alfa test aşamasında ve yalnızca en temel paket için editör başına ayda 12 dolar ödeyen aboneler için mevcut. Yeni model, yalnızca metinden videoya yetenekleriyle çıktığında bile oldukça ilgi çekmişti. Ancak, bir metinden videoya motoru ne kadar iyi olursa olsun, özellikle bir videodaki karakterlerin birden fazla istemde aynı görünmesi ve gerçek dünyadaymış gibi görünmesi söz konusu olduğunda, bunun içsel sınırları vardır. Görsel süreklilik olmadan, herhangi bir tür anlatı oluşturmak zordur. Runway’in önceki yinelemelerinde, kullanıcılar yalnızca metin istemlerine güvendiklerinde, farklı sahnelerde karakterleri ve ayarları tekdüze tutmakta sıklıkla zorluk çekiyorlardı.
Karakter ve çevre tasarımında güvenilir bir tutarlılık sunmak küçük bir şey değil, ancak farklı çekimler arasında tutarlılığı korumak için bir referans noktası olarak ilk bir görüntünün kullanılması yardımcı olabilir. Gen-3’te, Runway’in yapay zekası platformdaki ek hareket veya metin istemleriyle yönlendirilen 10 saniyelik bir video oluşturabilir. Aşağıdaki videoda nasıl çalıştığını görebilirsiniz.
Fotoğraflardan Filmlere
Runway’in görüntüden videoya özelliği yalnızca insanların ve arka planların uzaktan bakıldığında aynı kalmasını sağlamakla kalmıyor. Gen-3 ayrıca Runway’in dudak senkronizasyon özelliğini de içeriyor, böylece konuşan biri ağzını söylediği kelimelerle eşleşecek şekilde hareket ettiriyor. Bir kullanıcı AI modeline karakterinin ne söylemesini istediğini söyleyebilir ve hareket eşleşecek şekilde canlandırılır. Eşzamanlı diyalog ve gerçekçi karakter hareketlerini birleştirmek, videolar üretmenin yeni ve ideal olarak daha ucuz yollarını arayan birçok pazarlama ve reklam geliştiricisinin ilgisini çekecektir.
Runway, Gen-3 platformuna eklemeyi de bitirmedi. Bir sonraki adım, aynı geliştirmeleri video-video seçeneğine getirmek. Fikir, aynı hareketi farklı bir tarzda tutmak. Örneğin, sokakta koşan bir insan, ormanda hızla ilerleyen animasyonlu bir antropomorfik tilkiye dönüşüyor. Runway ayrıca Hareket Fırçası, Gelişmiş Kamera Kontrolleri ve Yönetmen Modu gibi kontrol özelliklerini Gen-3’e getirecek.
Yapay zeka video araçları hala geliştirmenin erken aşamalarında, çoğu model kısa biçimli içerik oluşturmada mükemmellik gösterirken daha uzun anlatılarla mücadele ediyor. Bu, Runway’i ve yeni özelliklerini bir pazar açısından güçlü bir konuma getiriyor, ancak tek başına değil. Midjourney, Ideogram, Leonardo (şimdi Canva’nın sahibi) ve diğerleri kesin yapay zeka video oluşturucuyu yapmak için yarışıyor. Elbette hepsi OpenAI ve Sora video oluşturucusunu dikkatle izliyor. OpenAI’nin diğer faydalarının yanı sıra isim tanınırlığı konusunda bazı avantajları var. Aslında, Toys”R”Us Sora’yı kullanarak kısa bir film reklamı yaptı ve bunu Cannes Lions Festivali’nde ilk kez gösterdi. Yine de, yapay zeka video oluşturucuları hakkındaki film henüz ilk perdesinde ve sonunda ağır çekimde tezahürat eden zafer kazananı kaçınılmaz olmaktan çok uzak.