Yapay zeka kullanarak sanat yapmak yeni değil. AI’nın kendisi kadar eski.
Yeni olan şey, bir araç dalgasının artık çoğu kişinin bir metin istemi girerek görüntü oluşturmasına izin vermesidir. Tek yapmanız gereken bir metin kutusuna “van Gogh tarzında bir manzara” yazmak ve yapay zeka talimat verildiği gibi güzel bir görüntü oluşturabilir.
Bu teknolojinin gücü, sanat üretimini kontrol etmek için insan dilini kullanma kapasitesinde yatmaktadır. Ancak bu sistemler bir sanatçının vizyonunu doğru bir şekilde tercüme ediyor mu? Dili sanat yapımına dahil etmek gerçekten sanatsal atılımlara yol açabilir mi?
Mühendislik çıktıları
Üretken yapay zeka ile çalıştım bir sanatçı ve bilgisayar bilimcisi olarak yıllardır ve ben bu yeni araç türünün yaratıcı süreci kısıtladığını iddia ediyorum.
AI ile bir görüntü oluşturmak için bir metin istemi yazdığınızda, sonsuz olasılık vardır. Sıradan bir kullanıcıysanız, yapay zekanın sizin için ürettiklerinden memnun olabilirsiniz. Ve yeni başlayanlar ve yatırımcılar milyarlar döktü makaleler, video oyunu karakterleri ve reklamlar için grafik oluşturmanın kolay bir yolu olarak görerek bu teknolojiye dahil oldu.
Buna karşılık, bir sanatçının vizyonunu yansıtan yüksek kaliteli bir görüntü oluşturmak için doğru kompozisyon, doğru aydınlatma ve doğru gölgeleme ile deneme benzeri bir istem yazması gerekebilir. Bu uzun bilgi istemi mutlaka görüntüyü tanımlamıyor ama genellikle sanatçının zihnindeki sistemi çağırmak için çok sayıda anahtar sözcük kullanıyor. Bunun için nispeten yeni bir terim var: hızlı mühendislik.
Temel olarak, bu araçları kullanan bir sanatçının rolü, sistemi istenen çıktıyı üretmeye zorlamak için doğru anahtar kelimeleri bulmak üzere sistemi tersine mühendislik yapmaya indirgenmiştir. Doğru kelimeleri bulmak çok fazla çaba ve çok fazla deneme yanılma gerektirir.
AI göründüğü kadar akıllı değil
Çıktıları nasıl daha iyi kontrol edeceğinizi öğrenmek için, bu sistemlerin çoğunun internetten resimler ve altyazılar üzerinde eğitilirler.
Tipik bir resim yazısının bir resim hakkında ne anlattığını düşünün. Altyazılar genellikle web’de gezinmedeki görsel deneyimi tamamlamak için yazılır.
Örneğin, resim yazısı, fotoğrafçının ve telif hakkı sahibinin adını açıklayabilir. Flickr gibi bazı web sitelerinde, bir başlık tipik olarak kamera tipini ve kullanılan lensi tanımlar. Diğer sitelerde başlık, bir görüntüyü işlemek için kullanılan grafik motorunu ve donanımı açıklar.
Bu nedenle, kullanışlı bir metin istemi yazmak için, kullanıcıların AI sisteminin karşılık gelen bir görüntü oluşturması için tanımlayıcı olmayan birçok anahtar kelime eklemesi gerekir.
Bugünün yapay zeka sistemleri göründüğü kadar akıllı değil; esasen büyük bir belleğe sahip olan ve ilişkilendirme ile çalışan akıllı geri alma sistemleridir.
Kontrol eksikliği nedeniyle hüsrana uğrayan sanatçılar
Bu gerçekten sanatçıların harika işler yaratmasına yardımcı olabilecek türden bir araç mı?
Kurduğum üretken bir yapay zeka sanat platformu olan Playform AI’da, Bir anket düzenledi sanatçıların üretken AI ile deneyimlerini daha iyi anlamak için. Diğerlerinin yanı sıra DALL-E, Stable Diffusion ve Midjourney gibi platformları kullanmış olan 500’den fazla dijital sanatçı, geleneksel ressam, fotoğrafçı, illüstratör ve grafik tasarımcıdan yanıt topladık.
Ankete katılanların yalnızca %46’sı bu tür araçları “çok yararlı” bulurken, %32’si onları biraz yararlı bulmuş ancak iş akışlarına entegre edememiştir. Kullanıcıların geri kalanı – %22 – onları hiç yararlı bulmadı.
Sanatçıların ve tasarımcıların vurguladığı ana sınırlama, kontrol eksikliğiydi. 0’dan 10’a kadar bir ölçekte, 10 en fazla kontrol olmak üzere, yanıt verenler sonucu kontrol etme yeteneklerini 4 ile 5 arasında tanımladılar. Yanıt verenlerin yarısı çıktıları ilginç buldu, ancak uygulamalarında kullanılacak kadar yüksek kalitede değildi.
Üretken yapay zekanın uygulamalarını etkileyip etkilemeyeceğine dair inançlara gelince, ankete katılan sanatçıların %90’ı etkileyeceğini düşündü; %46’sı etkinin olumlu olacağına inanırken, %7’si olumsuz etkisi olacağını tahmin ediyor. Ve %37’si uygulamalarının etkileneceğini düşündü ancak ne şekilde etkileneceğinden emin değildi.
En iyi görsel sanat dili aşar
Bu sınırlamalar temel mi, yoksa teknoloji geliştikçe ortadan mı kalkacaklar?
Elbette, üretici yapay zekanın daha yeni sürümleri, kullanıcılara daha yüksek çözünürlükler ve daha iyi görüntü kalitesi ile birlikte çıktılar üzerinde daha fazla kontrol sağlayacaktır.
Ama bana göre, sanat söz konusu olduğunda ana sınırlama temeldir: İmgeyi oluştururken dili ana itici güç olarak kullanma sürecidir.
Görsel sanatçılar, tanımı gereği, görsel düşünürler. Çalışmalarını hayal ettiklerinde, genellikle sözcüklerden değil, görsel referanslardan – bir anıdan, bir fotoğraf koleksiyonundan veya karşılaştıkları diğer sanat eserlerinden – yararlanırlar.
Görüntü üretiminin sürücü koltuğunda dil olduğunda, sanatçı ile dijital tuval arasında fazladan bir engel görüyorum. Pikseller yalnızca dil merceğinden işlenecektir. Sanatçılar, semantik sınırlarının dışında pikselleri manipüle etme özgürlüğünü kaybederler.
Metinden resme teknolojisinde başka bir temel sınırlama daha var.
İki sanatçı aynı istemi girerse, sistemin aynı görüntüyü oluşturması pek olası değildir. Bu, sanatçının yaptığı hiçbir şeyden kaynaklanmıyor; farklı sonuçlar basitçe yapay zekanın farklı rasgele başlangıç görüntülerinden başlayarak.
Başka bir deyişle, sanatçının çıktısı tesadüfe indirgenmiştir.
Anket yaptığımız sanatçıların yaklaşık üçte ikisi, yapay zeka nesillerinin diğer sanatçıların eserlerine benzeyebileceği ve teknolojinin kimliklerini yansıtmadığı, hatta tamamen onun yerine geçebileceği konusunda endişeleri vardı.
Sanat yapmak ve sanatı tanımak söz konusu olduğunda sanatçı kimliği konusu çok önemlidir. 19. yüzyılda fotoğraf popüler olmaya başladığında, fotoğrafın bir sanat olup olmadığı tartışması. Fotoğrafın bir sanat formu olarak telif hakkıyla korunup korunamayacağına karar vermek 1861’de Fransa’da bir davaya geldi. Karar, bir sanatçının benzersiz kimliğinin fotoğraflarla ifade edilip edilemeyeceğine bağlıydı.
İnternetin mevcut görüntüleri ile öğretilen AI sistemleri düşünüldüğünde aynı sorular ortaya çıkıyor.
Metinden resme yönlendirmenin ortaya çıkmasından önce, yapay zeka ile sanat yaratmak daha ayrıntılı bir süreçti: Sanatçılar genellikle kendi AI modellerini kendi görüntülerine göre eğittiler. Bu, kendi çalışmalarını görsel referanslar olarak kullanmalarına ve benzersiz tarzlarını daha iyi yansıtan çıktılar üzerinde daha fazla kontrol sahibi olmalarına izin verdi.
Metinden resme dönüştürme araçları, bir iş sunumu veya bir sosyal medya gönderisi için grafik oluşturmak isteyen belirli içerik oluşturucular ve sıradan günlük kullanıcılar için yararlı olabilir.
Ancak iş sanata geldiğinde, metinden görüntüye yazılımın sanatçının gerçek niyetlerini nasıl yeterince yansıtabileceğini veya izleyicileri etkileyen ve dünyayı yeniden görmelerini sağlayan güzelliği ve duygusal yankılanmayı veya çalışmaları nasıl yakalayabildiğini anlayamıyorum.
Yapay zeka, sohbet robotları ve makine öğreniminin geleceği hakkında daha fazla bilgi edinmek ister misiniz? Kapsamımızın tamamına göz atın yapay zekaveya kılavuzlarımıza göz atın En İyi Ücretsiz AI Sanat Üreticileri Ve OpenAI ChatGPT Hakkında Bildiğimiz Her Şey.
Ahmed ElgammalBilgisayar Bilimi Profesörü ve Sanat ve Yapay Zeka Laboratuvarı Direktörü, Rutgers Üniversitesi
Bu makale şu adresten yeniden yayınlanmıştır: Konuşma Creative Commons lisansı altında. Okumak orijinal makale.