Yapay zekadaki en son gelişme, önceden oluşturulmuş bir görüntüyü kendi belirlediğiniz özelliklere göre düzenlemenizi sağlayan bir araçtır.
Diyelim ki, “basit bir tıklama ve sürüklemeyle bir arabanın boyutlarını değiştirmek veya bir gülümsemeyi kaşlarını çatmak için manipüle etmek” istediğinizi varsayalım, bunu DragGAN adlı bu modelle yapabilirsiniz.
Generative Adversarial Network (GAN) şu anda bir araştırma makalesi halindedir, ancak demolarını izlemekle ilgilenenlerden o kadar ilgi gördü ki, araştırma ekibinin ana sayfası yoğun trafik nedeniyle kaza yaptı.
Sınır DragGAN’ı Photoshop’taki Çarpıtma aracıyla karşılaştırdı ve “pikselleri ezmediği”, bunun yerine “alttaki nesneyi yeniden oluşturduğu” ve hatta 3D görüntüleri döndürebildiği için çok daha güçlü olduğunu ekledi.
Böyle bir aracın potansiyeli, metinden görüntüye üretken yapay zekanın her zaman isteyebileceğiniz çıktıları vermemesi gerçeğinde yatmaktadır. Böylece otomatik olarak yeni bir görüntü oluşturmak yerine daha sonra geri dönüp mevcut bir görüntüde düzenlemeler yapabilirsiniz.
Araştırma raporunun bir parçası olan bazı demolar, bir dağa yükseklik eklemeyi, bir modelin konumunu değiştirmeyi ve kıyafetlerinin uzunluğunu ve şeklini düzenlemeyi, bir aslanın ağzını açıp kapatmayı ve bir kişinin yüzünü düz bir görünümden değiştirmeyi içerir. bir gülücük. Şu anda mevcut olan birçok AI aracıyla, kullanıcıların daha arzu edilen bir sonuç elde etmek için daha spesifik bir bilgi istemiyle bir görüntüyü yeniden oluşturması gerekiyor.
Araştırma ekibi, makalesinde, güncelleme için faydalı olan görüntülerin düzenlenmiş yönlerinin yenilenmesi kapsamında yeni ayrıntıların eklenebileceğini belirtti. “Yaklaşımımız, bir aslanın ağzındaki dişler gibi tıkalı içeriği halüsinasyona uğratabilir ve bir atın bacağının bükülmesi gibi, nesnenin sertliğini takiben deforme olabilir.”
Üretken AI içeriği için düzenleme seçenekleri sunmaya çalışan birçok marka var. Bununla birlikte, çoğu, görüntülerin gerçek düzenlemesine izin verecek kadar ileri gitmez, bunun yerine görüntülerin etrafında düzenleme gibi yönler için. Örneğin, Microsoft’un Designer uygulaması, bir metin isteminden AI görüntüleri oluşturmanıza olanak tanır ve üç sonuçtan en beğendiğinizi seçip, ardından onu tasarım stüdyosuna götürebilir ve burada bir dizi yaratıcılık ve üretkenlik tabanlı proje oluşturabilirsiniz. sosyal medya gönderileri, davetiyeler, dijital kartpostallar veya görselin odak noktası olduğu grafikler. Ancak, AI tarafından oluşturulan görüntüyü düzenleyemezsiniz.
DragGAN aracının şimdilik bir demo olması nedeniyle, özellikle demolar düşük çözünürlüklü videolara dayandığından, kolayca bulunabilen bir teknolojinin kalitesinin ne olacağı veya mümkün olup olmayacağı bile bilinmiyor. Ancak, yapay zekanın ne kadar hızlı gelişmeye devam ettiğine dair ilginç bir örnek.