Dall-E, Stable Diffusion ve Midjourney gibi metinden görüntüye yapay zeka tarafından gerçekleştirilen harika sonuçları muhtemelen duymuşsunuzdur. Tahmin edebileceğiniz gibi, devrim ilerliyor ve bir sonraki hedef metinden videoya yapay zeka araçları.

QuickVid, bir DJI Drone ve Mars’taki astronotlar hakkında bu videoyu oluşturdu.

Google ve Meta, yapay zeka laboratuvarlarından alınan araştırma raporlarında metinden videoya yeteneklerini alaya aldılar, ancak bu ileri teknoloji halka açık değildi. Basit bir AI komut istemiyle tüm videoları oluşturmayı deneme şansını sabırsızlıkla bekliyorsanız, şimdi şansınız, teşekkürler hızlı video.

Beklentileriniz çok yükselmeden önce, bunun binlerce Kararlı Difüzyon fotoğrafı oluşturup bunları bir video oluşturmak için bir araya getirmeye veya gerçek video üretimi için dünyanın en gelişmiş yapay zeka sistemlerine erişmeye eşdeğer olmadığını anlamanız önemlidir. Bu, metinden videoya bir çözüm için yarışa çok erken bir giriş.

AI için sürecin ilk adımı, isteminize göre bir komut dosyası oluşturmaktır. Şu sözlerden bir YouTube Shorts oluşturarak sistemi test ettim: “Mars’ta bir astronotun üzerinden uçan bir DJI insansız hava aracının, şaşırmış astronotun tepki çekimiyle biten bir videosu.”

AI, istemimden 79 kelimelik eksiksiz bir anlatım yazdı, ardından konuşmayı erkek veya kadın sesi seçimiyle sentezledi. TechCrunch oluşturulan video için seçilen arka plan videosunun bir stok kitaplığından alındığına ve görünüşe göre bol miktarda “Mars’taki astronotlar” görüntüsü olduğuna dikkat çekti.

Şüpheli bir son dokunuş olarak QuickVid, komut dosyasını başlıklar olarak kaplar ve Dall-E API tarafından oluşturulan küçük resimler ekler. Ortaya çıkan yukarıda görülen YouTube kısa filmi … ilginç. Belki de daha dünyevi videoları daha iyi idare ederdi.

Bir TechCrunch röportajında ​​QuickVid’in geliştiricisi, iyileştirmelerin geleceğini ve Ocak ayında daha fazla kişiselleştirme seçeneğinin geleceğini söyledi. Sonunda, QuickVid altyazıları ve destek avatarlarını da içerecektir.

Gelecek yıl, AR gözlükleri ve daha gelişmiş VR kulaklıkları gibi diğer görsel harikaların yanı sıra çok daha fazla metinden videoya dönüştürme çözümünün geldiğini görebiliriz. Heyecan verici olmalı.








genel-19