Birkaç kısa ay içinde, üretken yapay zeka dünyası, ChatGPT gibi sohbet robotlarından Midjourney tarafından oluşturulan fotogerçekçi görüntülere dönüştü. Her an işlerin yavaşladığını düşünüyorsanız, yapay zeka tarafından oluşturulan videolar büyük anlarını gözler önüne sermek üzere olabilir.

ile vurgulandığı gibi cıvıldamak Bu tür videolar için bir pazarlama platformunun kurucusu olan Philipp Tsipman’dan, son yedi gün içinde piyasaya sürülen beş yeni AI video üreticisi var. Kalite değişir, ancak teknolojinin amansız bir hızla ilerlediği açıktır. Öyleyse, sarsıntılıdan ciddi şekilde etkileyiciye kadar değişen beş yapay zeka video oluşturucuyu inceleyelim.

Video AI?’ya ayak uydurmakta zorlanıyorsanız *son 7 günde* 5 adet son teknoloji üretken video modeli yayınlandı*: ??? pic.twitter.com/cki9SMfozr

— Philip Tsipman (@ptsi) 26 Mart 2023

koşu yolu

Runway, herkese açık yapay zeka düzenlemesinde lider konumdadır. Maskeleme, hareket izleme, süper ağır çekim ve renk derecelendirme, yapay zeka yardımından yararlanır. Bu, aboneliğe dayalı bir hizmettir, bu nedenle sınırları zorlamak için ekstra teşvike sahiptir.

Şubat ayında Runway, bir videonun stilini kelimelerle değiştirmenize olanak tanıyan Gen-1 güncellemesiyle üretken videoyu test etmeye başladı. Sokakta bir yürüyüşün videosu, elle şekillendirilmiş ve poz verilmiş Claymation karakterleriyle yapılmış gibi görünen animasyonlu bir kısa filme dönüşüyor.

Runway bugün Gen-1’i herkese açık olarak piyasaya sürdü ve halihazırda Gen-2’yi test ederek bir referans video ihtiyacını ortadan kaldırıyor. Yakında Runway, basit bir metin istemiyle bir video oluşturmanıza izin verecek.

resim sanatı

Picsart’ı ücretsiz bir fotoğraf düzenleyici olarak tanıyabilirsiniz, ancak aynı zamanda video düzenleme de sunar. Text2Video-Zero, uyumlu görünmeye yetecek kadar ortak noktaya sahip birden fazla kare oluşturmak için Stable Difüzyon AI görüntü oluşturucuyu kullanan bir Picsart araştırma aracıdır.

Bu önemli bir ilerleme. AI görüntülerini video kareleri olarak bir araya getirmeye yönelik ilk deneyler, her ayrıntının sürekli olarak değiştiği kaotik sahneler üretti. Etki göz alıcıydı, ancak içerikten dikkati dağıttı.

Video P2P

Video-P2P, Runway Gen-1’e benzer açık kaynaklı bir projedir. Video girişini alır ve onu metin istemleriyle biçimlendirmek için Stable Diffusion’ı kullanır. Gösterilen örnekler, sabit arka planlar ve değiştirilen öğelerdeki tutarlılık ile iyi görünüyor.

Geçici Ağ

TemporalNet, resimlerde görünen figürlerin pozlarının daha fazla kontrol edilmesini sağlayan gelişmiş bir AI görüntü oluşturucu olan ControlNet’i temel alır.

Videolarda biraz titreme var, ancak sonuçlar umut verici. ControlNet, öngörülebilir sahneler üretmek için büyük bir adım attı ve TemporalNet, videolar oluşturmak için güzel bir alternatif yöntem sağlayabilir.

Metinden videoya

Metinden videoya, Alibaba tarafından oluşturulan bir AI modelidir. Bu modelin üzerinde biraz daha çalışılması gerektiği açık, ancak keşfedilecek daha fazla seçeneğe sahip olmak her zaman iyi bir şeydir.

hızlı & ? difüzörlerle daha uzun metinden videoya dönüştürme

Son zamanlarda ModelScope’un araştırma modelinden eğlenceli, çılgın metinden videoya görmüşsünüzdür.

dağıtıcılarla videonun uzunluğunu kontrol edebilir ve ücretsiz colab dahil smol VRAM GPU’lara sığdırabilirsiniz. Burada deneyin:https://t.co/uPVd9hEOtr pic.twitter.com/mIFkGnGT5V

— multimodal sanattan poli (@multimodalart) 22 Mart 2023

Hızlı inovasyon

AI inovasyonunun hızlı temposu olağanüstü. Sadece aylar önce, yapay zeka laboratuvarlarında yaratılan benzer videoların potansiyeline dair kısa bilgilerle dalga geçildik. 2022’de, halka açık ilk AI video oluşturuculardan biri, küçük AI görüntülerini stok görüntülerin üzerine yerleştirdi.

Yapay zekanın bu kadar kısa sürede ne kadar ilerlediğini gördüğünüzde, birkaç ay önceki bu “eski usul” yöntemler gülünç.








genel-19