Google, gelişmiş gerçekçilik, daha iyi uyum ve fotogerçekçilik ve empresyonizmden soyut ve animeye kadar daha geniş bir özel stil yelpazesi vaat eden Imagen 3 yapay zeka görüntü oluşturma modelinin yeni bir versiyonunu tanıttı.
Imagen 3’ün kendisine aşina olmasanız da, Gemini’yi bir görüntü oluşturmak için kullandıysanız veya hatta bir Android telefonda görüntüleri uyarladıysanız, büyük ihtimalle Imagen 3’teki modeli kullanmışsınızdır. Google DeepMind AI laboratuvarı. Bunu kullanmak için en iyi yer ImageFX laboratuvar deneyidir.
Yeni güncellemeyle Imagen 3, yalnızca görüntüleri işleme biçiminde değil, aynı zamanda istemleri anlama biçiminde de bir gelişme elde etti. Örneğin, artık lens türleri ve aydınlatma dahil olmak üzere fotoğrafçılığın dilini önceki modellere göre daha iyi anlıyor. Yani Imagen 3’ün bunlardan biri olma potansiyeli var. en iyi AI görüntü oluşturucuları.
Bunu test etmenin en iyi yolu, Google Labs’ın bir parçası olan tamamen ücretsiz ImageFX aracını kullanmaktır. Bunun, ilk sürüm oluşturulduktan sonra, örneğin lens türlerini değiştirerek istemi hızlı bir şekilde uyarlamanıza olanak tanıyan benzersiz bir özelliği vardır.
Imagen 3’ü teste tabi tutmak
Imagen 3’ün ne kadar iyi çalıştığını öğrenmek için bir dizi fotoğrafçılık tarzı bilgi istemi hazırladım. Bu istemlerin her biri farklı bir lens veya kamera tipi içerir. Bazılarının spor fotoğrafçılığı veya foto muhabirliği gibi farklı teknikleri de vardır.
Buradaki fikir, modelin görüntüyü ne kadar iyi ürettiğini ve daha da önemlisi istemde belirtilen anın duygusunu ve hissini ne kadar iyi yakaladığını görmektir.
1. Londra’da yağmurlu bir gün
Çoğu modelin bir sokak sahnesi oluşturması istendiğinde zorlandığı şeylerden biri insanları yerleştirmektir. Yolu kaldırımdan ayıramıyorlar ama Imagen 3 bunu doğru yapmış gibi görünüyor; birisi caddenin karşısına geçerken diğerleri kenarda duruyor.
Bilgi istemi: “Yağmurlu bir günde hareketli bir Londra caddesinin sokak seviyesinde fotoğrafı, ıslak kaldırımda yansımalar parıldarken şemsiye tutan insanlar, 35 mm lensle çekilmiş, sığ alan derinliği, arka planda kırmızı çift katlı bir otobüse odaklanıyor, doğal ışık, samimi an.”
2. Bir düşünme anı
Bu istem çok kolaylıkla başarısız olabilirdi. Büyük ölçüde parmaklar yüzünden. Evet, hemen hemen tüm modellerde parmak sorunu çözüldü ancak bardak tutarken veya yakından bakıldığında bazen zorluk yaşanıyor. Yaşı tasvir etmenin karmaşıklığını da ekleyin ve kolayca tekinsiz bir vadi elde edersiniz – burada o kadar da değil.
Bilgi istemi: “Yıpranmış elleri dumanı tüten bir fincan çay tutan, yumuşak güneş ışığı kırışıklıklarını ve gülümsemesini vurgulayan, kremsi bir bokeh arka planı, sıcak ve samimi bir ruh hali, doğal dış mekan için 85 mm f/1.4 lensle çekilmiş yaşlı bir kadının altın saat portresi ayar.”
3. Milleti beslemek
Burada modelin belirli bir aydınlatma türünü, ağların karmaşıklığını ve günün saatine göre doğru gölgeleri tasvir etmesini sağladık. Aynı zamanda demokrasi tarzı bir imajın gerekliliğini de dikkate almak zorundaydı.
Bilgi istemi: “Güneş doğarken okyanustan ağ çeken bir balıkçının foto muhabirliği görüntüsü, ışıkta parıldayan su damlacıkları, 24-70 mm f/2,8 lensle Canon EOS R5 ile çekilmiş, adamın ellerinde keskin ayrıntılara sahip yüksek kontrast ve dalgalar insanın dayanıklılığını yakalıyor.”
4. Barista’nın sanatı
Tuhaf bir şekilde latte sanatı, yapay zeka görüntü modellerinin zorlandığı bir konu. Imagen 3 sadece doğru olanı yapmakla kalmadı, aynı zamanda parmakları da doğru şekilde yerleştirdi.
Bilgi istemi: “Rustik bir Avrupa kafesinde kapuçinoya buharda pişirilmiş süt döken bir baristanın doğal ışıkta çekilmiş fotoğrafı, arka plan bulanık kalırken kahve fincanına yumuşak bir odaklanma, 50 mm f/1,8 lensle çekilmiş, yükselen buharı ve dokuyu yakalıyor köpükten.”
5. Anı yakalamak
Bu görüntüde birkaç değişiklik yapmam gerekti. Başlangıçta ter damlalarını tasvir etmek istemiştim ama yağmura benziyordu, bu yüzden yağmur motifini tercih ettim. İyi görünüyor.
Bilgi istemi: “Bir atletizm yarışı sırasında bir kısa mesafe koşucusunun orta adımdaki dinamik uzun pozlama çekimi, kaslar gerilmiş ve havada yağmur damlaları görülebiliyor, 70-200 mm f/2,8 telefoto lensle çekilmiş, son derece keskin deklanşör hızı yüksek. odaklama, arka planda hareket bulanıklığı.
6. Potansiyel dolu
Burada Imagen 3’ün bir görüntüdeki duyguyu yakalayıp yakalayamayacağını görmek istedim. Veya en azından sanatsal, model tarzı bir fotoğraf tasvir edin ve amacına ulaştı. Siyah beyaz bir görüntü için doğru gölgeleri ve sert ışığı doğru şekilde yakalamak.
Bilgi istemi: “Bir köprünün altında duran genç bir adamın yüksek kontrastlı siyah beyaz portresi, keskin gölgeler ve vurgular onun köşeli çene hattını ve yoğun bakışlarını vurguluyor, Leica M10 ve 50 mm lensle çekilmiş, zamana meydan okuyan bir görünüm için klasik film greni efekti .”
7. Samimi bir an
Bu, doğru olması için biraz ince ayar gerektiren başka bir görüntüydü. Bir çiftçinin sıradan ama etkileyici (iyi bir kamerayla çekilmiş) fotoğrafını istiyordum. Çiftçiyi, fotoğrafının çekilmesinden rahatsız ama aynı zamanda çiftliğiyle gurur duyacak şekilde konumlandırmak gerekiyordu.
Bilgi istemi: “Gün batımında mısır tarlasının ortasında gururla duran, mavi ay ışığının uzun gölgeler oluşturduğu, Nikon Z9 ve 35 mm f/1.4 lensle çekilen, çiftçinin yüzünde bokeh etkisi yaratan yaşlı bir çiftçinin çevre portresi. arka plan yumuşak bir şekilde bulanıklaştırılmış buğday sıralarını gösterirken, kırsal yaşamın cesaretini ve kayıtsızlığını yakalıyor.
Bir şey daha: Berbat fotoğrafçılık
Imagen 3’ün kötü fotoğrafçılıkla ne kadar iyi başa çıkabileceğini görmek istedim. Modellerin baş döndürücü sanat eserleri, gerçekçi harika fotoğraflar ve insan yapımı olup olmadığını sorgulamanıza yol açan soyut parçalar yaratabilmesi harika bir şey; peki ya kötü resimler?
Imagen 3’e bu istemi, 80’li ve 90’lı yıllarda kameralarda yaygın olarak bulunan berbat fotoğraf türlerini nasıl ele aldığını görmek için verdim. Hayal kırıklığına uğramadım.
Bilgi istemi: “Bir film kamerasıyla sert bir flaş kullanılarak çekilen, yemek masasında oturan iki kişinin yüzlerini doyuran, arkalarındaki duvarda kırmızı göz ve derin, hoş olmayan gölgeler oluşturan, yakın mesafeden çekilen, zayıf aydınlatılmış bir iç mekan fotoğrafı. hafif merkez dışı çerçevelemeyle.”