Sohbet robotları ve metinden görüntüye oluşturucuların interneti kasıp kavurmasıyla, yapay zekanın bir sonraki sınırı, metinden videoya oluşturucular olabilir.

Nvidia kısa bir süre önce Toronto Yapay Zeka Laboratuvarı’ndaki deneyleri üzerine, metin istemlerinden hareketli sanat sonuçları elde edebilen bir araç oluşturmak için Kararlı Difüzyonu nasıl kullandığını ayrıntılarıyla anlatan “Gizli Yayılma Modelleri ile Yüksek Çözünürlüklü Video Sentezi” adlı bir araştırma makalesi yayınladı.

Teknoloji şirketi, büyük miktarda bilgisayar işlemesi olmadan video klipler oluşturmak için metin kullanan Gizli Yayılma Modellerinin (LDM’ler) demolarını sergiledi. TechRadar kayıt edilmiş.

Araç, 1.280 x 2.048 çözünürlükte yaklaşık 4,7 saniye uzunluğunda videolar olan GIF tarzı hareketli görüntüler üretebilir. Araştırma makalesine göre, 512 x 1024 daha düşük çözünürlükte daha uzun videolar da oluşturabiliyor.

Teknolojinin bir demosunu görüntüleyen TechRadar, aracın bu noktada bir metinden GIF’e dönüştürme aracı olarak muhtemelen ideal olduğunu söyledi. Yayın, aşağıdaki gibi basit istemleri kolayca işleyebileceğini belirtti: sahilde süpüren bir fırtına askeri veya oyuncak ayı elektro gitar çalıyor, yüksek çözünürlüklü, 4K. Buna rağmen, Midjourney gibi düzenli olarak kullanılan diğer AI araçlarında yaygın olduğu gibi, sonuç yine de GIF’lerde rastgele eserler ve lekelenmeye neden oldu.

Yayın, daha uzun videoların prime time’a gelmeden önce biraz daha geliştirilmesi gerektiğine inanıyor, ancak Nvidia’nın teknolojiyi hazır hale getirmek için hızla çalışacağını düşünüyor. Stok kitaplıkları ve benzer amaçlar için iyi çalışabilirler.

AI metinden videoya oluşturucularla deney yapan başka şirketler de var. Google, 20 saniyelik klipler üreten daha uzun istemlere izin veren Phenaki oluşturucusunun tanıtımını yaptı. Runway adlı başka bir girişim, yine Stable Diffusion’a dayanan ikinci nesil video modelini geçen ay duyurdu. Bilgi isteminin demosu New York’ta bir çatı katının penceresinden sızan ikindi güneşi durağan görüntülere nasıl hafif hareketli efektler ekleyebileceğinizi gösterir.

TechRadar’a göre kullanıcılar, Adobe Firefly ve Adobe Premiere Rush gibi diğer programlara yapay zekanın eklenmesinden de yararlanacak.

Narakeet ve Lume5 gibi diğer bazı şirketler kendilerini metinden videoya oluşturuculara sahip olarak pazarlıyorlar. Bununla birlikte, bu araçların çoğu, benzersiz bir çalışma oluşturmak yerine, metni, sesi, görüntüleri ve belki de halihazırda üretilmiş bazı video kliplerini bir araya getirerek daha çok PowerPoint sunumları gibi çalışır.








genel-19