Yapay zeka etkileyici görüntüler üretebilir, ancak bu görüntülerin çok fazla dişe sahip insanlar veya Escher tarzı sokak düzenlerine sahip şehir manzaraları gibi garip sorunlara sahip olması nadir değildir. Google Gemini, bu tür sorunları düzeltmek için AI görüntü oluşturma özelliğini yükseltmeye çalışıyor, çünkü ilk olarak benekli Android Authority tarafından tamamlanmamış kodda. Görünen o ki, kullanıcıların AI tarafından oluşturulan görüntülerinde ayrıntılı düzenlemeler yapmalarına olanak sağlayacak bir ince ayar yeteneği yolda.
Google Gemini’nin metinden görüntüye dönüştürme araçları şu anda görüntü oluşturulduktan sonra düzenleme yapamıyor. Bunun yerine, kullanıcılar yeni istemler göndermek zorunda kalıyor ve yeni istemin herhangi bir sorunu çözeceğini ve görmek istedikleriyle eşleşen bir şey yaratacağını umuyorlar. Bu, yalnızca küçük ama yine de dikkat dağıtan bir hata varsa özellikle sıkıcı olabilir. Ortaya çıkarılan koda göre, Gemini’nin ince ayar özelliği, iki düzenleme yöntemiyle sınırlı değişiklik ihtiyacını giderecek.
İlk seçenek kullanıcıların AI tarafından oluşturulan bir görüntü hakkında bir istem göndermesine ve bir görünümde değişiklik istemesine olanak tanır. Örneğin, yukarıdaki görüntüyü beğendiyseniz ancak bir şehre yerleştirmek istiyorsanız, robotu ve kuşu tutabilir ancak Gemini’den bunları hareket ettirmesini isteyerek arka planı değiştirebilirsiniz. Kodda açıklanan ikinci yöntem daha etkileşimli bir yaklaşımdır. Kullanıcılar, değiştirmek istedikleri görüntü bölümünü parmaklarını veya bir kalem kullanarak daire içine alabilirler. Alan seçildikten sonra, istenen değişiklikleri açıklayabilirler ve Gemini talimatların yalnızca daire içine alınan bölümle ilgili olduğunu anlayacaktır.
AI Düzenleme Başarısı
Bu düzenleme araçları özellikle görsel doğruluğun ve hızlı teslim sürelerinin çok önemli olduğu grafik tasarım, pazarlama ve sosyal medya gibi alanlardaki kişilere fayda sağlayabilir. Google Gemini, cilalı görsel içerikleri daha verimli bir şekilde oluşturmak isteyen sanatçıların, tasarımcıların ve sıradan kullanıcıların ihtiyaçlarını daha iyi karşılayabilir. Bu özelliklerin kesin yayın tarihi belirsizliğini korurken, kodda görünmeleri bunun çok da uzun sürmeyeceğini gösteriyor. Ayrıca yakında çıkacak olan Ask Photos resim arama özelliği gibi ilgili özelliklerle de iyi bir şekilde eşleşiyor.
Google, AI görüntü oluşturucularına düzenleme araçları dağıtan ilk şirket olmayacak. Bu yöntemler büyük ölçüde OpenAI’nin Dall-E AI görüntü oluşturma modelleri portföyünde bulunanlarla aynıdır. ChatGPT’de kullanıcılar önceden üretilmiş bir görüntüde ayarlamalar isteyebilir veya görüntünün bazı kısımlarını vurgulayıp resmin o kısmını ayarlayan yeni bir metin istemi gönderebilirler. Ideogram.ai ve Adobe Firefly gibi birçok AI görüntü oluşturucusu için benzer özellikler mevcuttur. Yine de Google’ın bu ince ayar araçlarını dahil etme planı Gemini için teknik bir sıçramadır. Bu, Google’ın üretken AI araçları söz konusu olduğunda OpenAI, Meta ve diğer yerlerdeki rakiplerine yetişme ve onları geride bırakma yönündeki devam eden çabasını işaret ediyor.