Mutluluk subjektiftir ve tespit edilmesi zordur. 100 sanatçıdan saf bir mutluluk imgesi yaratmalarını ya da 100 şairden konu hakkında yazmalarını isteseydiniz, sonuç için uzun süre beklerdiniz ama aynı zamanda 200 farklı yorum da alırsınız.
Yapay zekanın saf mutluluk kavramını, özellikle de yapay zeka video oluşturucularını ne kadar iyi ele aldığını görmeye karar verdim. Piyasada çeşitli tamamlanma ve yetenek aşamalarında düzinelerce var, bu yüzden hepsine aynı talimatı verdim.
Runway ve Pika Labs gibi bariz daha büyük platformlara ek olarak, nasıl karşılaştırıldıklarını görmek için Leonardo ve NightCafe’in Stable Diffusion tabanlı jeneratörlerini ve Assistive Video ve PixVerse gibi Discord tabanlı yeni modelleri de dahil ettim. Henüz OpenAI’den Sora yok; bu yılın sonlarında gelmesi planlanıyor.
Yorumların hepsi hem farklı hem de şaşırtıcı derecede benzerdi. Farklı türde bir yapay zeka video platformu olduğu ve dolayısıyla daha kısa biçimli tek çekim oluşturucularla karşılaştırılamadığı için LTX Studio’yu dahil etmemeye karar verdim. Ancak referans olarak, ayçiçeği tarlasında yürüyen bir kadın ve köpeği gibi ayçiçekleri üretti.
Yapay zeka saf mutluluğu gösterebilir mi?
İlk görevim, gerçek mutluluğun neye benzediğini belirtmeyen, yaklaşık bir cümle uzunluğunda olan, bazı video oluşturucuların kelime sınırlaması olduğu ve yalnızca tek bir sahne çekimi oluşturacağı için fazla bir şey beklemediği bir bilgi istemi oluşturmaktı. birkaç saniye uzunluğunda.
Ben şunu buldum: “Saf mutluluğun özünün, duyguyu sembolizm, metafor ve atmosfer yoluyla yakalayan görsel bir temsili.”
Buradaki fikir, yapay zekayı, benim onu nasıl yönlendirdiğimi takip etmek yerine, bunun ne anlama geldiğini yorumlamaya zorlamasıdır. Daha doğrudan bir yönlendirmeyle yapılan daha önceki deneyler, yapay zeka modelleri arasında daha az farklılığa yol açmıştı.
Mücadeleyi ayarlama
Bu zorluk için yalnızca görüntü oluşturma yeteneklerini ve saf mutluluk kavramını nasıl yorumladıklarını test eden, metinden videoya dönüştürme olanağı sunan hizmetleri kullandım.
Aksi takdirde bu, bir yapay zeka görüntü oluşturucusunun saf mutluluğu anladığının test edilmesi ve ardından farklı yapay zeka video araçlarının bu görüntüyü nasıl canlandırdığına bir bakış olurdu ve geçen hafta görüntü araçlarına baktık.
Her AI video aracının ayarlara ve ince ayarlara farklı bir yaklaşımı olduğundan, her şeyi varsayılan olarak bıraktım. İsteme girdim ve özelleştirme olmadan oluştur’a tıkladım. Gerektiğinde yaptığım tek ayar değişikliği mümkünse 16:9 görüntü elde ettiğimden emin olmaktı.
Yapay zeka görüntü oluşturucularının önceki testlerinde olduğu gibi, herhangi bir kümedeki ilk görüntüyü seçtim. Bunun nedeni, farklı araçların varsayılan olarak size farklı sayıda resim vermesidir. Bu yüzden, yaratılanların en iyisi olmasa bile, her zaman birinci görseli seçiyorum.
1. Haiper
Hayper nispeten yeni ama aynı zamanda çok güçlü. Modeli inanılmaz derecede yetenekli ve yalnızca bir metin isteminden hem ince hem de gerçekçi hareketler yaratabiliyor. Daha büyük platformların özelleştirme için daha fazla seçeneği olsa da Haiper bir istemi daha yakından takip ediyor.
Balonlar, çiçekler ve çiçek açan bir ağaçla hikaye kitabı gibi bir ortam yaratıldı. Ortada saçları dalgalanan, kolları rüzgarda heyecanla uçuşan küçük bir çocuk var. Sanırım tüm videolar arasında beni gülümsetmeye en yakın olanı bu.
2.Leonardo
Merkezde Leonardo çeşitli Stabil Difüzyon tabanlı modellerin ince ayarlı ve özelleştirilmiş versiyonları kullanılarak oluşturulmuş bir yapay zeka görüntü oluşturma platformudur. İsteme girdiğimde zaten açık olduğundan Photoreal v2 özelliğini kullandım. Görüntüleri canlandırmak için Stabil Video Difüzyonunu kullanır.
Leonardo dört seçenek yarattı ve ilkinin en iyisi olduğunu düşünmüyorum. Diğerleri ayçiçeği tarlasında oynayan bir çocuğu tasvir ederken, bir diğeri gece gökyüzüne bakan birini gösteriyordu. Ancak bu, bir trenin penceresinden dünyayı seyreden genç bir kızın her yönüyle çok gerçekçi görünen güzel bir görüntüsüydü.
3. Yardımcı Video
Yardımcı Video Assistive’in sohbet arayüzü etrafında oluşturulmuş daha geniş bir özellik kümesinin parçasıdır. Bunu Discord’da kullandım ve başka hiçbir ayrıntı belirtmeye gerek kalmadan basit bir istemle çalıştığı için hem şaşırtıcı derecede hızlı hem de kullanımı kolaydı.
Bu bir yetişkini tasvir eden tek videoydu. Görünüşe göre, gelinlik olabilecek bir kadını, gün batımında başının üzerinde çiçeklerle dolu bir tarlada tam anlamıyla süzülüyormuş gibi gösteriyor. Mutluluğun bir olaydan geldiği fikrine kapılıyor gibi görünüyor.
4. Pist
Koşu yolu üretken yapay zeka videosunun açık ara lideridir. Gen-2’de çeşitli kuruluşlarla ortaklık anlaşmaları ve fotogerçekçi ve esnek bir model bulunmaktadır.
Saf mutluluk kavramını yorumlayışı hem güldürdü hem de şaşırttı. Runway, saf mutluluğun yemekte yattığını düşünüyor. Özellikle beyaz keklerde.
5. Gece Kafesi
Leonardo gibi Gece Kafesi Stable Diffusion modellerinin üzerine kurulmuş bir yapay zeka görüntü platformudur, ancak her ikisi de kendi özelleştirilmiş ve ince ayarlı sürümlerini kullandığından her ikisini de bu teste dahil ettim. NightCafe ayrıca yakın zamanda daha hızlı uyum sağlayan Stable Core’u da benimsedi.
Yorumu yine balonlarla ilgiliydi, ama insanlar yerine arka planda parlak, devasa bir ay ve çok doğal bir manzara olan güzel, eski bir kaleydi. Beni mutlu edip etmediğinden emin değilim ama bir sakinlik hissi var.
6. PixVerse
Şu anda yalnızca Discord’da mevcut – tüm büyük AI video oluşturucuları bir noktada olduğu gibi – PixVerse stil ve hareketi belirlemenize de olanak tanıdığı için ilginç bir modeldir.
Bu resimde, güneşin ısıtan ışınlarının tadını çıkaran, kolları iki yana açılmış, her an sıcaklığı ve neşeyi içen küçük bir çocuk görülüyordu. Animasyon sırasında kızın yüzü biraz çarpık görünse de çok mutlu bir görsel.
7. Pika Laboratuvarları
Pika Laboratuvarları çalışmayı en sevdiğim AI video araçlarından biridir. Kolay arayüzü, ses efektleri ve dudak senkronizasyonu gibi diğer teknolojilerin benimsenmesinin yanı sıra iç boyama, onu yeni bir projeye doğrudan atlamak için mükemmel kılar.
Saf mutluluk yorumu yapay zeka modellerinden beklediğime daha yakındı. Parlak, renkli bir sahnede, çiçeğe benzeyecek şekilde boyanmış, gülümseyen bir çocuğu tasvir ediyordu.
8. Final Çerçevesi
seviyorum Son Çerçeve. Yeni teknolojilere hızla atlayan ve dudak senkronizasyonu, düzenleme ve sesler gibi bunları entegre eden, ön yüklemeli bir yapay zeka platformudur. Ayrıca daha uzun nesiller için kliplerin bir araya getirilmesini kolaylaştıran bir zaman çizelgesi tipi düzenleyici görünümüne de sahiptir.
Metinden videoya geçiş yaptığınızda, önce aralarından seçim yapabileceğiniz bir dizi görüntü oluşturulur ve ardından görüntüye göre video oluşturulur. Listedeki ilkini seçtim ve biraz büyülüydü; arkasında lazer gösterisi olan, sıçrayan bir kızın hikaye kitabı benzeri bir sahnesini gösteriyordu. Bu tuhaf bir şeydi ama aynı zamanda tam anlamıyla saf bir mutluluk olmasa da onun neşesini yakaladığını hissetti.
9. MetaAI Hayal Edin
Meta Hayal EtYakın zamanda yeni MetaAI sohbet robotunun içinde güncellenen . Yalnızca kare ve düşük çözünürlüklü video sunar ve video prodüksiyonu için tasarlanmış bir şeyden çok GIF’e benzer şekilde canlandırılmıştır.
Bu istemin yorumu, insanla ilgili olmayan tek yorumdu. Şaşırtıcı derecede dijital bir yapıya sahip ve teknolojiyi aşırı amfromorfize etmiyor, bu da bu klibin yapay zeka perspektifinden en iyi şekilde hissettirilmesini sağlıyor.
Hangi AI jeneratörü kazandı?
Hepsi ilginçti ve hiçbirinin, istemin amaçladığı şekilde “saf mutluluğu” gerçekten yakaladığını düşünmüyorum. Referans olarak, buna benzer son testi kazanan Ideogram’a da aynı uyarıyı verdim ve kuantum aleminden bir şey yarattı!
Video oluşturucular için, kekleri seven şişman bir adam olarak farklı olduğu için ödülü Runway’e vermek istiyorum ama Haiper’in saf mutluluk kavramını en iyi yakaladığını düşünüyorum.
Sanırım en az ve en sevdiğim Meta görseliydi. Kötü ya da iyi olduğu için değil, sıra dışı olduğu için. Konsepti, insanlardan ziyade yapay zekanın mutluluk fikri etrafında inşa edilmişti, ancak Meta henüz geniş ekran klipler oluşturamadığı için başarısız oldu.