Son birkaç ayda, ChatGPT gibi büyük dil modellerinin metin kopyası oluşturabildiğini, Stable Diffusion gibi görüntü oluşturucuların istek üzerine nasıl resim oluşturabildiğini ve hatta bazılarının metinden konuşmaya nasıl yapabildiğini gördük. Daha Sonra Pizza adını alan girişimci bir geliştirici, beş farklı AI modelini birleştirerek “Pepperoni Hug Spot” adlı hayali bir pizza restoranı için bir canlı aksiyon reklamı yarattı.

Ortaya çıkan ve aşağıya eklediğim video aynı anda hem ürkütücü hem de etkileyici. Reklamda yemek yiyen, yemek pişiren ve çok iştah açıcı pepperoni pizza dağıtan foto-gerçekçi insanlar yer alıyor. Hatta kulağa insan gibi gelen bir diyalog ve düzgün bir arka plan müziği var. Ancak bazı karakterlerin yüz ifadeleri ve ölü gözleri biraz fazladır.

Açıkçası, çıktının kalitesi arzulanan bir şey bırakıyor. Bazen nesneler birbiriyle karışıyor gibi görünür; oğlum, insanların tabaktan çıkan pizzayı yiyormuş gibi göründüğünü söyledi.

Pepperoni Hug Spot Reklamı

(İmaj kredisi: Tom’un Donanımı)

İnsanların hepsi tekinsiz vadinin sakinleri gibi görünüyor. Ve biraz tutarsız olan senaryo, başka bir dilden yanlış bir şekilde İngilizceye çevrilmiş metin gibi okur (gerçi öyle değildi).

Pepperoni Hug Spot Reklamı

(İmaj kredisi: Tom’un Donanımı)

Ancak, bu teknolojilerin prime time’a ne kadar yakın olduğunu görmek etkileyici. Foto-gerçekçi video görüntülerinin kısa sürede nasıl çok daha inandırıcı hale gelebileceğini görebiliriz.



genel-21