Artık ChatGPT ve Midjourney hemen hemen ana akım haline geldiğine göre, bir sonraki büyük yapay zeka yarışı metinden videoya oluşturucular ve Nvidia, GIF’lerinizi yakında yeni bir düzeye taşıyabilecek bazı etkileyici teknoloji demolarını gösterdi.

A yeni araştırma makalesi ve mikro site (yeni sekmede açılır) Nvidia’nın Toronto Yapay Zeka Laboratuvarı’ndan “Gizli Yayılma Modelleri ile Yüksek Çözünürlüklü Video Sentezi” adlı, bize sürekli büyüyen en iyi yapay zeka sanat üreteçleri listesine katılmak üzere olan inanılmaz video oluşturma araçlarının tadına bakmamızı sağlıyor.

Gizli Yayılma Modelleri (veya LDM’ler), büyük bilgi işlem gücüne ihtiyaç duymadan videolar oluşturabilen bir yapay zeka türüdür. Nvidia, teknolojisinin bunu, metinden görüntüye oluşturucuların, bu durumda Stable Difüzyon’un çalışmasını temel alarak ve “gizli alan difüzyon modeline geçici bir boyut” ekleyerek yaptığını söylüyor.

(İmaj kredisi: Nvidia)

Başka bir deyişle, üretken yapay zekası, durağan görüntülerin gerçekçi bir şekilde hareket etmesini sağlayabilir ve onları süper çözünürlük teknikleri kullanarak yükseltebilir. Bu, sürüş videoları için 1280×2048 çözünürlüğe sahip kısa, 4,7 saniyelik uzun videolar veya 512×1024 daha düşük çözünürlükte daha uzun videolar üretebileceği anlamına gelir.

İlk demoları (yukarıdaki ve aşağıdakiler gibi) görünce hemen düşündük, bunun GIF oyunumuzu ne kadar artırabileceği. Tamam, video oluşturmanın demokratikleşmesi ve otomatik film uyarlamaları olasılığı gibi daha büyük sonuçlar var, ancak bu aşamada metinden GIF’e dönüştürme en heyecan verici kullanım durumu gibi görünüyor.

Elektro gitar çalan bir oyuncak ayı

(İmaj kredisi: Nvidia)

“Sahilde süpüren bir fırtına askeri” ve “oyuncak ayı elektro gitar çalıyor, yüksek tanımlı, 4K” gibi basit komutlar, bazı kreasyonlarda doğal olarak eserler ve geçişler olsa bile oldukça kullanışlı sonuçlar üretir.



işletim-sistemi-1