ChatGPT gibi LLM’ler size istediğiniz herhangi bir metni verirken ve Stable Diffusion gibi grafik oluşturucular bir komut istemine dayalı bir görüntü oluştururken, metinden videoya yapay zeka hala gelişmekte olan bir alandır. Bu haftanın başlarında, bir metinden videoya dönüştürme aracı kullanan bir AI Pizza Reklamı hakkında haber yapmıştık. Pist Gen-2 (yeni sekmede açılır) videosu için. Ancak, şu anda Runway Gen-2 yalnızca davetlilere açık bir beta sürümündedir. Yani, davet edilmediğiniz sürece deneyemezsiniz.
Neyse ki, Hugging Face’te (önde gelen AI geliştirici portalı) NeuralInternet Text-to-Video Playground adlı tamamen ücretsiz ve kullanımı kolay bir araç var, ancak yalnızca iki saniye ile sınırlı, bu da animasyonlu bir GIF için neredeyse yeterli. Kullanmak için Hugging Face hesabınızın olması bile gerekmez. İşte nasıl.
2 Saniyelik Yapay Zeka Metin Video Klibi Nasıl Oluşturulur
1. Şuraya git: Metinden Videoya Oyun Alanı (yeni sekmede açılır) tarayıcınızda.
2. Bir bilgi istemi girin bilgi istemi kutusuna girin veya sayfanın altındaki Örnek istemlerden birini deneyin (ör: “Ata binen bir astronot”)
3. Tohum numaranızı girin. Tohum, AI’nın görüntüyü oluşturmak için bir başlangıç noktası kullandığı bir sayıdır (-1’den 1.000.000’e kadar). Bu, 1’lik bir tohum kullanırsanız, her seferinde aynı istemle aynı çıktıyı almanız gerektiği anlamına gelir. Size her seferinde rastgele bir tohum numarası veren -1 tohum kullanmanızı öneririm.
4. Çalıştıra tıkla.
Metinden Videoya Oyun Alanının sonucunu oluşturması birkaç dakika alacaktır. Sonuç penceresine bakarak ilerlemeyi görebilirsiniz. Sunucunun sahip olduğu trafik miktarına bağlı olarak daha uzun sürebilir.
5. Oynat düğmesini tıklayın videonuzu oynatmak için
6. Videonuza sağ tıklayın ve Videoyu Farklı Kaydet’i seçin videoyu (MP4 olarak) PC’nize indirmek için.
Kullandığı Model ve Sonuçları
Metinden Videoya oyun alanı, ModelScope adlı Çinli bir şirketin metinden videoya modelini kullanıyor. 1,7 milyar parametre (yeni sekmede açılır). Görüntülerle ilgilenen birçok AI modelinde olduğu gibi, ModelScope modelinin de iki saniyelik çalışma süresinin ötesinde bazı sınırlamaları vardır.
Her şeyden önce, eğitim veri setinin, bazıları telif hakkıyla korunan ve filigranlı olanlar da dahil olmak üzere çok çeşitli web görüntülerinden aldığı açıktır. Birkaç örnekte, bir parçanın bir kısmını gösterdi. Doğrulanmış (yeni sekmede açılır) videodaki nesnelerde filigran. Shutterstock, ücretli üyelik gerektiren, önde gelen bir telifsiz görsel sağlayıcısıdır, ancak eğitim verileri, görsellerini izinsiz almış gibi görünüyor.
Ayrıca, her şey olması gerektiği gibi görünmüyor. Örneğin, zeki kaiju hayranları, aşağıdaki pizza yiyen Godzilla videomun dev bir yeşil kertenkele olan ancak herkesin en sevdiği Japon canavarının ayırt edici özelliklerinden hiçbirine sahip olmayan bir canavarı gösterdiğini fark edeceklerdir.
Son olarak, belki de söylemeye gerek yok ama bu videolarda ses yok. Bunların en iyi kullanımı, onları arkadaşlarınıza gönderebileceğiniz animasyonlu GIF’lere dönüştürmek olabilir. Yukarıdaki resim, iki saniyelik Godzilla-yeating-pizza videolarımdan birinden yaptığım animasyonlu bir GIF.
Yapay zekada içerik oluşturma hakkında daha fazla bilgi edinmek istiyorsanız, Auto-GPT’yi otonom bir aracı yapmak için nasıl kullanacağınız veya BabyAGI’yı nasıl kullanacağınız hakkındaki makalelerimize bakın.