Nvidia (yazarın bir müşterisi) son zamanlarda, meta veriyi tasarlamak için tasarlanmış iş istasyonları oluşturmaktan, insan dijital ikizlerine dönüşen dijital asistanlara ve herkesin çekici sanatlar yaratmasına izin verebilecek araçlara kadar pek çok büyüleyici şey yapıyor. Daha ilginç araçlardan biri Jeneratör TarzıGANresimleri karıştırarak insanların yüzlerini oluşturur.

Bu yapay zeka tabanlı teklif için eğitim seti, kullanıcıya kaynak materyalde neredeyse sınırsız esneklik sağlayan 70.000 yüksek kaliteli PNG görüntüsü (her biri 1024×1024 piksel çözünürlükte) içerir.

StyleGAN 2018’den beri piyasada, 2019’da daha yaygın hale geldi kaynak kodu açık kaynağa geçtiğinde, ve şimdi üçüncü permütasyonunda. StyleGAN3 geçen Ekim ayında piyasaya sürüldü.

Görüntülerle çalışan bizler için avantajlar, telif hakkı sorunlarıyla karşılaşmadan veya telif hakkı ihlali endişesi duymadan, onları büyük korumalı kaynak görüntü havuzlarından oluşturabilme olanağını içerir. Ve süreç diğer görüntüleri içerecek şekilde geliştikçe (temelde bir görüntü harmanlama motorudur), çeşitli kaynaklardan gelen profesyonel fotoğrafları harmanlayarak benzersiz güzellikte görüntüler veya anılardan veya hayal gücünden yaratılmış resimler veya çok az bağlantıyla veya hiç bağlantı olmadan oluşturmanıza izin verebilir. gerçek bir şey.

StyleGAN gibi yapay zeka güdümlü bir görüntü karıştırma aracı, bir dizi endüstriyi ve uygulamayı önemli ölçüde değiştirebilir ve iyileştirebilir (veya daha kötü “derin sahteler” için kullanılabilir). Hadi keşfedelim.

Otomatik suç eskiz sanatçıları mı?

Televizyonda çok sayıda suç prosedürü izliyorum; Genellikle birinin, gözlemledikleri bir suçlunun görüntüsünü oluşturmak için bir eskiz sanatçısının önünde oturduğu bir bölüm vardır. Tüm bu süreç, bir konuşma yapay zekası tarafından otomatikleştirilebilir. Tanığa, komut sırasında resim kurbanın hafızasıyla eşleşene kadar karıştırılan özelliklerin örnekleriyle gelişen bir resim gösterilebilir. Nihai sonuç, yüz tanıma programları tarafından suçluyu hızlı bir şekilde bulmak için kullanılabilecek fotogerçekçi bir görüntü olacaktır. (İkincil zarar, kanun uygulayıcı eskiz sanatçılarına artık ihtiyaç duyulmaması olacaktır.)

Bu teknolojinin büyük bir etkisi olabileceği alanlardan biri, kaçırılan çocukların yerinin bulunmasıdır. AI, çocuğun imajını hızla yaşlandırabilir, böylece daha sonra hayatta daha iyi tanımlanabilirler.

Pazarlama, TV ve filmler

Birçok pazarlama materyali, üretimde stok görseller veya modeller kullanır. İlkiyle ilgili sorun, bu aynı görüntülerin başka kampanyalarda da kullanılabilmesidir – yanlışlıkla farklı kampanyaları birbirine bağlar. Örneğin, bir ilaç reklamında ve bir restoran için aynı görsel kullanılıyorsa, müşteriler ikisini ilişkilendirebilir ve restorandan kaçınabilir. Aynı sorun, bazı aktörler ve modeller rakipler arasında hareket ettiğinden, daha sonra başka bir kampanyaya katılan canlı bir model kullanmaktan kaynaklanabilir. Canlı modeller/aktörler, bir markaya veya reklam kampanyasına zarar verebilecek kişisel sorunlar yaşayabilir.

Ancak StyleGAN gibi bir şeyden harmanlanmış görseller ve videolar kullanmak, firmanız tarafından telif hakkıyla korunan, herhangi bir stok görselden benzersiz olan ve yaşayan veya ölü herhangi bir oyuncu veya modele bağlı olmayan bir görsel oluşturabileceğiniz anlamına gelir. Sonuç, daha düşük maliyet ve daha da önemlisi daha düşük risktir. Sonuçları daha hızlı alırsınız ve model ve aktörlere olan ihtiyaç azalır. Oyuncuları yalnızca kimliklerini gizleyen 3B görüntüleme takımlarında kullanabilirsiniz ve meta veri deposu araçları ve 3B görüntüleyicilerdeki ilerlemelerle onlara ihtiyacınız bile olmayabilir. Ayrıca filmlerde oyunculara ihtiyaç duymamamıza büyük bir adım daha yaklaştırıyor.

İnsan dijital ikizleri mi?

Nvidia’nın araştırdığı başka bir alan, meta veri tabanı için dijital ikizlerin oluşturulmasını içeriyor. Ve bu ikizlerin arkasındaki yapay zeka geliştikçe, kaynak materyalden daha ayırt edilemez hale geleceklerdi. Bu olduğunda, sonucun sahibi kim? Bir çalışanın dijital ikizlerine sahip olması gerektiğini iddia edebilirsiniz. Ancak, hem görüntüleri hem de çalışanın becerilerini harmanlamak için StyleGAN gibi bir araç kullanılırsa, bu konum daha belirsiz hale gelir; bir şirket, sonucun mülkiyetini koruyabilir. (Gelecekteki çalışanların ve sendikaların, çalışanları tazminatsız olarak yerinden etmek için kullanılan bunun gibi bir şeyle önemli sorunlar yaşayabileceğini düşünüyorum.

Karışık bir gelecek

Bir ölçekte korunabilecek (veya korunmayabilecek) kaynak materyali harmanlama yeteneği, özellikle potansiyel yasal sorunları ortadan kaldırıyorsa, zorlayıcıdır. Nvidia’nın süreci, yasal teşhiri ortadan kaldıran denetlenmiş bir görüntü kaynağı kullanır, ancak bunun gibi araçlar yalnızca stok fotoğraf veritabanlarına güvenmek zorunda değildir; sosyal medya gönderilerinden, filmlerden veya diğer reklam materyallerinden alınan tanınmış kişilerin resimlerinde kullanılabilirler.

Bir noktada, bu teknolojinin, kompozit görüntülerle ilgili telif hakkı yasalarının yeniden yazılmasını zorunlu kılacağını umuyorum. Aynı zamanda, iş ve eğlencede kullanılabilecek fotogerçekçi filmler ve görüntüler oluşturmak için harcanan çabayı ve maliyeti de azaltacaktır. Model, oyuncu veya yönetmen olarak çalışanlar ve ezberlenmiş olayları tanımlayan görüntüler oluşturmakla görevli sanatçılar için mevcut iş uygulamalarına ve ilgili gelirlere gelen büyük değişikliklerin erken bir örneğidir.

StyleGAN gibi araçlar, sanal medyanın geleceğini iş, hükümet ve eğlence için yeniden tanımlayacak.

Telif Hakkı © 2022 IDG Communications, Inc.



genel-13