Metinden görüntüye yapay zeka sistemleri şu anda hem yetenek hem de popülerlik açısından patlama yaşıyor ve dünyanın en popüler uygulamasındaki görünümlerinden daha iyi bir kanıt var mı: TikTok.

Video platformu kısa süre önce, kullanıcıların yazılımın daha sonra bir görüntü olarak oluşturacağı bir metin istemi yazmasına olanak tanıyan “AI yeşil ekran” olarak adlandırdığı yeni bir efekt ekledi. Bu görüntü daha sonra bir videonun arka planı olarak kullanılabilir – potansiyel olarak içerik oluşturucular için çok kullanışlı bir araç.

TikTok’un sisteminin çıktısı, Google’ın Imagen’i, OpenAI’nin DALL-E 2’si veya Midjourney’in isimsiz yazılımı gibi son teknoloji metinden görüntüye modellerinkiyle karşılaştırıldığında oldukça basit. Yalnızca oldukça soyut ve dönen görüntüler yaratır; TikTok’un “okyanustaki astronot” ve “çiçek galaksisi” gibi önerilen istemlerinin rüya gibi doğasına yansıyan bir güç. Karşılaştırıldığında, diğer modeller hem fotogerçekçi görüntüler hem de insanlar tarafından çizilmiş veya boyanmış gibi görünen karmaşık ve tutarlı çizimler üretebilir.

TikTok’un modeli yalnızca dönen, soyutlanmış, bulaşmış görüntüler üretiyor. Modern değil – ama muhtemelen daha iyisi için.
Resim: Sınır

Yine de TikTok’un modelinin sınırlamaları kasıtlı olabilir. İlk olarak, daha gelişmiş modeller, şirketin uygulaması için pahalı ve kaynak yoğun olacak daha fazla bilgi işlem gücü gerektirir. İkincisi, TikTok’un bir milyardan fazla kullanıcısı var ve tüm bu bireylere hayal edebilecekleri her şeyin fotogerçekçi görüntülerini yaratma gücü vermek, neredeyse kesinlikle bazı rahatsız edici sonuçlar doğuracaktır.

Örneğin, metinden görüntüye oluşturucuların genellikle sınırlamaya çalıştığı iki tür çıktı olan çıplaklık ve kan oluşturma yeteneğini test ettik. “Boris Johnson suikastı” ve “Joe Biden suikastı” gibi şiddet içeren uyarılara dayanan resimler, Birleşik Krallık başbakanının hemen hemen tanınabilir yüzüyle çoğunlukla soyut girdaplar üretir (adamın tanıdık sarışın paspası karikatürü özellikle kolaylaştırır) .

Modelin çıktısının soyut doğası, kışkırtıcı bir dille istemlerin yalnızca girdaplar ürettiği anlamına gelir.
Resim: Sınır

Aynı şekilde, çıplaklık içeren bir talep – “plajda çıplak model” – ten tonları, kumlu portakallar ve okyanus mavileri dahil olmak üzere tematik olarak uygun renkler üretir, ancak hiçbir şey papazın kızarmasına neden olmaz.

Modelin çıplak görüntüler oluşturmasını sağlamaya çalışmak sizi hiçbir yere götürmez.
Resim: Sınır

TikTok’un “AI greescreen”inin görünümü hakkında dikkate değer olan şey, bu teknolojinin ne kadar hızlı ana akım haline geldiğini göstermesidir. Metinden görüntüye yapay zeka için en son geliştirme döngüsü, muhtemelen 2021’de OpenAI tarafından DALL-E’nin orijinal sürümüyle başladı. İki yıldan kısa bir süre sonra teknoloji, TikTok gibi bir uygulama aracılığıyla şimdiden milyonların elinde.

Bu sistemlerin hem zarar hem de fayda potansiyeli göz önüne alındığında, bundan sonra işler daha da garipleşecek.



genel-2