
Video odaklı yapay zeka (AI) firması olan pist, Pazartesi günü yeni bir video üretim modeli tanıttı. Gen-4 olarak adlandırılan, şirketin Gen-3 Alpha AI modelini başaran bir görüntü-Video üretim modelidir. Sahnelerdeki karakterler, konumlar ve nesnelerdeki tutarlılık ve kontrol edilebilir gerçek dünya fiziği de dahil olmak üzere çeşitli iyileştirmelerle birlikte gelir. Pist, yeni AI modelinin de daha yüksek hızlı bağlılıkla geldiğini ve sahnenin stilini, ruh halini ve sinematik unsurlarını basit komutlarla koruyabileceğini iddia ediyor.
Pist Gen-4 Görüntü-Video Üretim Modelini Tanıtıyor
Bir postalamak X’te (eski adıyla Twitter olarak bilinir), Runway’in resmi kolu yeni video modelinin piyasaya sürüldüğünü duyurdu. Gen-4 şu anda şirketin çift katmanlarına ve kurumsal müşterilere sunuluyor. Ücretsiz katman için ne zaman mevcut olabileceğine dair bir kelime yoktur. Post, “Gen-4, üretken ortamda sadakat, dinamik hareket ve kontrol edilebilirlik için önemli bir adımdır” diye ekledi.
Gen-3 alfa modelinin halefi, tutarlı stiller, konular, konumlar ve daha fazlası ile görüntü ve video üretimi sunmak için çeşitli geliştirmelerle birlikte gelir. Şirket ayrıca tamamen Gen-4 video üretim modelini kullanarak yapılan birkaç kısa film yayınladı.
Bir Blog yazısışirket yeni yetenekleri detaylandırdı. Pist, tek bir referans görüntüsü ile AI modelinin farklı aydınlatma koşullarında, konumlarda ve kamera açılarında tutarlı karakterler üretebileceğini söylüyor. Aynı şey nesneler için de geçerli olduğu söylenir. Kullanıcılar bir nesnenin referans görüntüsünü sağlayabilir ve tutarlılık sağlarken herhangi bir konuma veya koşula yerleştirilebilir. Runway, bunun kullanıcıların aynı görüntü referansını kullanarak anlatı tabanlı içerik ve ürün çekimleri için videolar oluşturmalarını sağladığını söylüyor.
Referans görüntünün yanında bir metin açıklaması sağlayarak, AI modeli, yakın çekimler ve geniş açılı yan profiller de dahil olmak üzere farklı açılardan bir sahne oluşturabilir ve referansta eksik detayları bile yakalayabilir. Şirketin Gen-4 Excels’i iddia ettiği bir diğer alan da gerçek dünyadaki fizik ve hareketin anlaşılmasıdır.
Bir videodaki konular çevre ile etkileşime girdiğinde, AI modeli gerçek dünya fiziğinin ve gerçekçi hareketin eklenmesini sağlar. Bu, su gerçekçi bir sıçrama ve hareketli çalıların gerçekçi bir hareket yarattığı şirket tarafından paylaşılan gösteri videolarında da görüldü.
Ancak şirket, dinamik ve yüksek sadakatli çıktılar için AI modelini eğitmek için kullanılan veri kümesini açıklamamıştır. Şirketin şu anda olduğu göz önüne alındığında, bu ilginç bakan Pistin modellerini telif hakkıyla korunan materyalle ilgili modellerini izinsiz olarak eğittiğini iddia eden sanatçılara ve rakip üretken AI şirketlerine karşı bir dava.

