Adobe’nin üretken yapay zeka modelleri ailesi olan Firefly, yaratıcılar arasında pek iyi bir üne sahip değil.

Özellikle Firefly görüntü oluşturma modeli şu şekilde alay edilmiştir: hayal kırıklığı Ve kusurlu Midjourney, OpenAI’nin DALL-E 3 ve diğer rakipleriyle karşılaştırıldığında, uzuvları ve manzaraları bozma ve yönlendirmelerdeki nüansları kaçırma eğilimi var. Ancak Adobe, bu hafta şirketin Max London konferansı sırasında piyasaya sürülen üçüncü nesil modeli Firefly Image 3 ile durumu düzeltmeye çalışıyor.

Artık Photoshop (beta) ve Adobe’nin Firefly web uygulamasında mevcut olan model, daha uzun, daha karmaşık istemleri ve sahneleri anlama yeteneği sayesinde önceki modele (Resim 2) ve önceki modele (Resim 1) göre daha “gerçekçi” görüntüler üretiyor yanı sıra geliştirilmiş aydınlatma ve metin oluşturma yetenekleri. Adobe, tipografi, ikonografi, raster görseller ve çizgi sanatı gibi şeyleri daha doğru bir şekilde oluşturması gerektiğini ve yoğun kalabalıkları ve insanları “ayrıntılı özelliklerle” ve “çeşitli ruh halleri ve ifadelerle” tasvir etme konusunda “önemli ölçüde” daha becerikli olduğunu söylüyor.

Ne olursa olsun, bilimsel olmayan kısa testlerimde, Resim 3 yapmak Resim 2’den bir adım önde gibi görünüyor.

Resim 3’ü kendim deneyemedim. Ancak Adobe PR, modelden birkaç çıktı ve bilgi gönderdi ve ben de aynı istemleri, Görüntü 3 çıktılarını karşılaştıracak örnekler almak için web’deki Görüntü 2 aracılığıyla çalıştırmayı başardım. (Resim 3 çıktılarının isteğe göre seçilmiş olabileceğini unutmayın.)

Resim 3’teki bu vesikalık fotoğraftaki aydınlatmanın, Resim 2’deki altındaki ışıkla karşılaştırıldığında dikkat edin:

Adobe Ateşböceği

Resim 3’ten. Komut: “Genç kadının stüdyo portresi.”

Adobe Ateşböceği

Resim 2’deki yukarıdaki istemin aynısı.

Image 3 çıktısı, Image 2 örneğinde büyük ölçüde bulunmayan gölgeleme ve kontrastla gözlerime daha ayrıntılı ve gerçekçi görünüyor.

İşte Resim 3’ün sahne anlayışını gösteren bir dizi resim:

Adobe Ateşböceği

Resim 3’ten. İstem: “Stüdyosunda masasında oturan ve tonlarca tablo ve ruhani şeylerle dalgın görünen bir sanatçı.”

Adobe Ateşböceği

Yukarıdaki istemin aynısı. Resim 2’den.

Görüntü 2 örneğinin, ayrıntı düzeyi ve genel ifade gücü açısından Görüntü 3’ün çıktısıyla karşılaştırıldığında oldukça basit olduğunu unutmayın. Resim 3’teki numunenin gömleğinde (bel bölgesi civarında) öznede bir çarpıklık mevcut, ancak poz, deneğin Resim 2’deki pozundan daha karmaşık. (Ve Resim 2’nin kıyafetleri de biraz farklı.)

Image 3’teki gelişmelerin bir kısmı şüphesiz daha büyük ve daha çeşitli bir eğitim veri setine dayandırılabilir.

Resim 2 ve Resim 1 gibi Resim 3 de yüklemeler konusunda eğitilmiştir. Adobe Stock, Adobe’nin telifsiz medya kütüphanesi ve telif hakkı süresi dolmuş lisanslı ve kamu malı içerikle birlikte. Adobe Stock ve dolayısıyla mevcut eğitim veri seti de sürekli olarak büyüyor.

Davaları önlemek ve görüntüler üzerinde ayrım gözetmeksizin eğitim veren üretken yapay zeka satıcılarına (örn. OpenAI, Midjourney) karşı kendisini daha “etik” bir alternatif olarak konumlandırmak amacıyla Adobe, eğitim veri seti için Adobe Stock katılımcılarına ödeme yapacak bir programa sahiptir. (Ancak programın şartlarının oldukça şeffaf olduğunu belirteceğiz.) Tartışmalı bir şekilde Adobe, Firefly modellerini AI tarafından oluşturulan görüntüler üzerinde de eğitiyor ve bazıları bunu bir tür veri aklama olarak değerlendiriyor.

Son Bloomberg raporlama Adobe Stock’ta yapay zeka tarafından oluşturulan görüntülerin Firefly görüntü oluşturma modellerinin eğitim verilerinden hariç tutulmadığını ortaya çıkardı; bu görüntülerin içerebileceği düşünüldüğünde rahatsız edici bir olasılık. telif hakkıyla korunan materyal. Adobe, AI tarafından oluşturulan görsellerin eğitim verilerinin yalnızca küçük bir bölümünü oluşturduğunu ve ticari markaları veya tanınabilir karakterleri tasvir etmediğinden veya sanatçıların adlarına atıfta bulunmadığından emin olmak için bir denetleme sürecinden geçtiğini iddia ederek bu uygulamayı savundu.

Elbette ne çeşitli, daha “etik” kaynaklı eğitim verileri ne de içerik filtreleri ve diğer korumalar kusursuz kusursuz bir deneyimi garanti etmez; bkz. kuşları uçuran insanlar Resim 2 ile. Resim 3’ün gerçek testi, topluluk onu ele geçirdiğinde gelecektir.

Yapay zeka destekli yeni özellikler

Image 3, Photoshop’ta geliştirilmiş metinden resme dönüştürmenin ötesinde birçok yeni özelliğe güç veriyor.

Resim 3’teki yeni “stil motoru” ve yeni otomatik stilizasyon düğmesi, modelin daha geniş bir renk, arka plan ve nesne pozu dizisi oluşturmasına olanak tanıyor. Kullanıcıların modeli, gelecekte oluşturulacak içeriğin renklerinin veya tonunun hizalanmasını istedikleri bir görüntüye göre koşullandırmasına olanak tanıyan bir seçenek olan Referans Görüntüsünü beslerler.

Üç yeni üretken araç – Arka Plan Oluştur, Benzer Oluştur ve Ayrıntıyı Geliştir – görüntüler üzerinde hassas düzenlemeler gerçekleştirmek için Görüntü 3’ten yararlanın. (Kendini tanımlayan) Arka Plan Oluştur, arka planı mevcut görüntüye uyum sağlayan oluşturulmuş bir arka planla değiştirirken Benzer Oluştur, fotoğrafın seçilen bir bölümünde (örneğin bir kişi veya bir nesne) varyasyonlar sunar. Ayrıntıyı Geliştirme özelliği, keskinliği ve netliği artırmak için görüntülere “ince ayar” yapar.

Bu özellikler tanıdık geliyorsa bunun nedeni Firefly web uygulamasında en az bir aydır (ve Midjourney’de bundan çok daha uzun süredir) beta sürümde olmalarıdır. Bu onların Photoshop’taki ilk çıkışını işaret ediyor — beta olarak.

Web uygulamasından bahsetmişken Adobe, AI araçlarına giden bu alternatif rotayı ihmal etmiyor.

Image 3’ün piyasaya sürülmesiyle aynı zamana denk gelen Firefly web uygulaması, Adobe’nin “yaratıcı kontrolü ilerletmenin” yeni yolları olarak sunduğu Yapı Referansı ve Stil Referansını alıyor. (Her ikisi de Mart ayında duyuruldu, ancak artık geniş çapta kullanılabilir hale geliyorlar.) Yapı Referansı ile kullanıcılar, bir referans görselinin “yapısına” (örneğin, bir yarış arabasının önden görünümü) uyan yeni görseller oluşturabilirler. Stil Referansı, esas olarak, bir hedef görüntünün stilini (örneğin kalem çizimi) taklit ederken bir görüntünün içeriğini (örneğin, Afrika Safarisindeki filler) koruyan, başka bir adla stil aktarımıdır.

İşte Yapı Referansı iş başında:

Adobe Ateşböceği

Gerçek görüntü.

Adobe Ateşböceği

Yapı Referansı ile dönüştürüldü.

Ve Stil Referansı:

Adobe Ateşböceği

Gerçek görüntü.

Adobe Ateşböceği

Stil Referansı ile Dönüştürüldü.

Adobe’ye, tüm yükseltmelerle birlikte Firefly görüntü oluşturma fiyatlandırmasının değişip değişmeyeceğini sordum. Şu anda en ucuz Firefly premium planı aylık 4,99 dolardır; Midjourney (ayda 10 dolar) ve OpenAI (ayda 20 dolarlık ChatGPT Plus aboneliğinin arkasında DALL-E 3’e kapı açan) gibi rekabeti altüst etmektedir.

Adobe, mevcut katmanlarının şimdilik aynı kalacağını söyledi. üretken kredi sistemi. Ayrıca Adobe’nin Firefly’da oluşturulan eserlerle ilgili telif hakkı taleplerini ödeyeceğini belirten tazminat politikasının da değişmeyeceğini ve AI tarafından oluşturulan içeriğe filigran ekleme yaklaşımının da değişmeyeceğini söyledi. Yapay zeka tarafından oluşturulan medyayı tanımlayan meta veriler olan İçerik Kimlik Bilgileri, ister sıfırdan oluşturulmuş ister üretken özellikler kullanılarak kısmen düzenlenmiş olsun, web ve Photoshop’taki tüm Firefly görüntü nesillerine otomatik olarak eklenmeye devam edecek.





genel-24