Bugüne kadar, en popüler metinden fotoğrafa üretken yapay zekalardan biri olan Midjourney, yalnızca metinsel bir açıklamayla ifade edilen ve daha sonra hiper-gerçekçi fotoğraflar oluşturmak için algoritma tarafından “çevrilen” bir fikirden başlama olanağı sunuyordu. Yakında CEO David Holtz’un resmi Discord sunucusundaki bir mesaj aracılığıyla duyurduğu yeni işlev sayesinde, yapay zeka tarafından oluşturulmasa bile mevcut görselleri değiştirmek mümkün olacak. Bu önemli bir yenilik, çünkü başka hiçbir araç henüz benzer bir olasılık önermemişti.
Teknolojik ve yaratıcı bir sıçrama
Her ne kadar piyasada yapay zeka tarafından oluşturulan görselleri rötuşlamanıza izin veren araçlar mevcut olsa da bunlar çoğunlukla sistemin kendisi tarafından üretilen çalışmalarla sınırlıdır. Midjourney bu modeli kırarak önceden var olan görüntülere müdahale etme olanağı sunuyor. Yalnızca teknolojik açıdan değil (sistem tarafından görüntünün derinlemesine anlaşılmasını gerektirir) değil, aynı zamanda görüntü manipülasyonu üzerindeki etkisi açısından da önemli bir gelişme. Deepfake’in giderek büyüyen bir tehdit oluşturduğu bir çağda, gerçek kişilerin görsellerinin rızası olmadan değiştirilebilmesi, etik ve yasal kaygıları artırıyor.
Yeni teknoloji nasıl çalışıyor?
Holtz, bu güncellemenin kalbinin, yapay zekanın basit metinsel açıklamalara dayalı olarak görüntünün şekline ve dokusuna müdahale etmesine olanak tanıyan bir teknoloji olan “derinlik kontrol ağları” tarafından temsil edildiğini açıkladı. Web’den herhangi bir görüntüyü yüklemek ve özelleştirmek mümkün olacak: öğeleri büyütün veya küçültün, açıları ayarlayın ve hatta fotoğraftaki nesnelerin malzemelerini veya yüzeylerini değiştirmek gibi karmaşık değişiklikler yapın.
Resim yüklendikten sonra kullanıcılar çeşitli araçlara erişebilecek. Discord’a gitmeye gerek kalmadan doğrudan Midjourney web sitesi üzerinden görüntüyü büyütüp küçültmek, perspektifi değiştirmek ve işlem yapmak mümkün olacak. En popüler eklemelerden biri, görüntünün belirli noktalarında hassas değişiklikler yapmanıza olanak tanıyan dijital fırçadır. En yenilikçi işlevlerden biri, görüntünün yapısını değiştirmeden renkleri ve yüzeyleri değiştirmenize olanak tanıyan “Yeniden Dokulandırma”dır. Siyah deri bir ceketin şeklini değiştirmeden kırmızı ipek bir cekete dönüştüğünü hayal edin. Görüntüyü anlama konusundaki bu yeni yetenek, çok çeşitli yaratıcı ve profesyonel kullanımların yolunu açıyor. Örneğin tasarımcılar, fotoğrafçılar veya reklamverenler, Photoshop gibi karmaşık yazılımlara başvurmadan görsellerindeki ayrıntıları hassaslaştırabilirler.
Büyük güç, büyük sorumluluk getirir
Midjourney, etik sonuçların zaten farkında ve tanımlamayı kolaylaştırmak ve kötüye kullanımı önlemek için yapay zeka tarafından oluşturulan görüntülere meta veriler uygulamaya başladı. Ancak görüntülerin kökenini doğrulamak için daha kapsamlı bir yaklaşım sunan daha geniş kapsamlı C2PA standardına henüz katılmamıştır. Holtz, yeni özelliğe erişimin başlangıçta küçük bir kullanıcı grubuyla sınırlı olacağını ve sonuçların izlenmesi için insan denetiminin sağlanacağını söyledi. Bu “beta” yaklaşımı, büyük ölçekli bir sürümden önce teknolojinin sonuçlarını daha iyi incelememize olanak tanıyacak. CEO, “Bu özelliğin sınırlamalarını en iyi şekilde nasıl yöneteceğimizden henüz emin değiliz” diye açıkladı. «Erişilebilirlik ve kontrol arasında doğru dengeyi bulmak için kullanıcılardan geri bildirim toplamak istiyoruz». Olası suiistimallere karşı güvenlik önlemlerinin daha da iyileştirilmesine hizmet edecek ılımlı bir yaklaşım. Şirket bugüne kadar yapay zeka tarafından oluşturulan görüntüleri işaretlemek için Dijital Kaynak Türü standardını zaten benimsiyor ancak birçok kişi bu önlemlerin tek başına derin sahtekarlıklar veya görsel tahrifatlar gibi manipüle edilmiş içeriğin yayılmasını durdurmak için yeterli olmadığını savunuyor. Giderek daha fazla şirketin benzer sorunlarla karşı karşıya kalması nedeniyle Midjourney’in kararları yalnızca rekabeti değil aynı zamanda sektördeki yeni düzenlemelerin belirlenmesini de etkileyebilir.