Hayır, henüz bitmedi: AI araçlarının görüntüleri manipüle etme yeteneği gelişmeye devam ediyor. En son örnek şimdilik yalnızca bir araştırma makalesi, ancak çok etkileyici, kullanıcıların bir resmin öğelerini görünümlerini değiştirmek için basitçe sürüklemelerine izin veriyor.
Bu, ilk bakışta çok heyecan verici görünmüyor, ancak bu sistemin neler yapabileceği hakkında bir fikir edinmek için aşağıdaki örneklere göz atın.
Basit bir tıklama ve sürüklemeyle yalnızca bir arabanın boyutlarını değiştirmekle veya bir gülümsemeyi kaşlarını çatmakla değiştirmekle kalmaz, aynı zamanda bir resmin öznesini 3 boyutlu bir modelmiş gibi döndürebilir, örneğin birinin baktığı yönü değiştirebilirsiniz. Hatta bir demo, kullanıcının birkaç tıklamayla bir göldeki yansımaları ve bir dağ sırasının yüksekliğini ayarladığını gösteriyor.
İşte çeşitli konularda bir genel bakış:
Manzara manipülasyonuna daha yakından bir bakış:
Ve sırf eğlence olsun diye, aslanlarla uğraşmak için:
Bu videolar gelen araştırma ekibinin ana sayfasıTwitter tarafından siteye gönderilen trafik miktarı nedeniyle kilitleniyor olsa da (esas olarak @_akhaliq kullanıcısı tarafından, ilginç AI makalelerini vurgulayarak harika bir iş çıkaran ve ilginizi çekiyorsa takip etmeye değer). ArXiv’deki araştırma makalesini de okuyabilirsiniz. tam burada.
Sorumlu ekibin not ettiği gibi, bu çalışmayla ilgili gerçekten ilginç olan şey, ille de görüntü manipülasyonu değildir. kendi başına, ancak kullanıcı arabirimi. Bir süredir gerçekçi görüntüler oluşturmak için GAN’lar gibi yapay zeka araçlarını kullanabiliyoruz, ancak çoğu yöntem esneklik ve hassasiyetten yoksun. Bir yapay zeka görüntü oluşturucuya “savana doğru ilerleyen bir aslanın resmini yapmasını” söyleyebilirsiniz ve bir tane elde edersiniz, ancak bu gerçek olmayabilir. bire bir aynı İstediğiniz veya ihtiyacınız olan poz.
DragGAN isimli bu model buna net bir çözüm sunuyor. Arayüz, geleneksel görüntü çarpıtma ile tamamen aynıdır, ancak mevcut pikselleri basitçe lekelemek ve ezmek yerine, model konuyu yeniden oluşturur. Araştırmacıların yazdığı gibi: “[O]Yaklaşımınız, bir aslanın ağzındaki dişler gibi tıkalı içeriği halüsinasyona uğratabilir ve bir atın bacağının bükülmesi gibi, nesnenin katılığına bağlı olarak deforme olabilir.”
Açıkçası bu şimdilik sadece bir demo ve teknolojiyi tamamen değerlendirmek imkansız. (Örneğin, son görüntüler ne kadar gerçekçi? Mevcut düşük çözünürlüklü videolara dayanarak bunu söylemek zor.) Ancak bu, görüntü işlemeyi daha erişilebilir hale getirmenin başka bir örneği.