Google’ın en gelişmiş görüntü oluşturucusu, teknoloji devinin bu yılki Google I/O etkinliğinde modeli tanıtmasından aylar sonra geldi. Imagen 3 modeli artık Google’ın Gemini AI platformunda, hem ücretsiz sürüm hem de abonelik tabanlı Gemini Advanced hizmeti ve Google’ın iş ürünleri aracılığıyla kullanılabilir. Google, Imagen 3’ün, kelimeleri görüntülere dönüştürme konusundaki kendi yaklaşımıyla AI görüntü oluşturucuları arasındaki hızla büyüyen rekabetle rekabet etmesini açıkça istiyor.
Önceki sürümleri gibi Imagen 3 de yukarıda görülen fotogerçekçi manzaralar ve çizgi filmvari kil animasyonu dahil olmak üzere birçok stilde görüntü oluşturabilir. Yeni sürüm, özellikle insanların resimlerini çekme konusunda Imagen 2’yi birçok yönden geliştiriyor. Şirket, Imagen 3’ün bu yılın başlarında şirketi utandıran tarihi hatalara düşmeyeceğini güçlü bir şekilde ima etti. Bununla birlikte, “fotogerçekçi, tanımlanabilir bireyler” hala yasaktır.
Imagen 3 ayrıca geçen ay kodda görülen gerçek zamanlı düzenleme seçeneklerini de içeriyor. Gemini’ye oluşturulan resimler hakkındaki fikrinizi söyleyebilir ve AI’ya istediğiniz şekilde değiştirmesini söyleyebilirsiniz. Şirket, ayarlamak istediğiniz resmin bir kısmını daire içine alabilmekten bahsetmedi ancak bu daha sonra olabilir. Imagen 3, Gemini genelinde İngilizce olarak entegre edildi ancak daha fazla dil yolda. Imagen 3’ün, Google’ın insanların varsayılan bir seçenek olarak kullanmasını istediği Gemini için büyük bir çekim noktası olması bekleniyor; tıpkı birçok insanın düşünmeden arama motoruna gitmesi gibi.
AI Görüntü Savaşı
Imagen 3 ayrıca Google’ın Gemini ile oluşturulan AI tarafından oluşturulan görselleri filigranlamak için SynthID aracıyla görselleri işaretlemesini sürdürüyor. SynthID, görsellere görünmez filigranlar yerleştirir, böylece fark etmezsiniz, ancak bunu gerçek bir fotoğraf veya sizin çizdiğiniz bir şeymiş gibi gösterme girişimi hızla çürütülür. Google bunu yanlış bilgiye karşı koymanın ve AI görsellerinin dünyasını daha şeffaf hale getirmenin bir yolu olarak tanımlıyor. SynthID, Google tarafından Imagen 3 için kullanılan güvenlik önlemlerinden bir diğeridir ve insanların, şiddet içeren görsellerin ve diğer sorunlu sahnelerin resimlerini üretmeye karşı koruma önlemleriyle birlikte kullanılır.
Imagen 3, AI görüntü oluşturma ve bunların her türlü içerik oluşturma platformuna entegrasyonundaki hızlı ilerlemelerin açık bir göstergesidir. Bu, Google’ın tamamladığı çoğu alanda üstünlük sağladığı bir alandır. Ideogram, Midjourney ve diğer AI görüntü oluşturucuları genellikle bağımsız araçlardır. Öte yandan, OpenAI, ChatGPT için önemli bir özellik olarak DALL-E’ye sahiptir ve X yakın zamanda Flux’u Grok AI sohbet robotuna yerleştirdi. Imagen 3, Gemini ile birleştirildiğinde Google’a kesin bir destek sağlıyor, ancak AI görüntü oluşturucularından hangisinin yarışa hakim olacağını bilmenin bir yolu yok. Foto(gerçekçi) bir bitiş olacak.


