Google, belirli bir metin açıklamasına dayalı bir görüntü oluşturucu olan Imagen adlı yeni projesini tanıttı.
Geliştiricilere göre, Imagen sinir ağı, başka bir AI destekli görüntü üreticisi olan OpenAI’den DALL-E 2’den daha iyi performans gösteriyor. Şu anda Imagen halka açık değil, ancak sergilenen örnekler etkileyici.
Google’a göre, yeni metinden görüntüye modeli, “benzeri görülmemiş derecede bir fotogerçekçilik ve derin bir dil anlayışı” ile karakterize ediliyor.
Google, basit çizimlerden yağlı boya tablolara ve bilgisayar grafiklerine kadar çeşitli stiller içeren Imagen’in çalışmalarının resimlerini ve örneklerini sağladı. Bunlara, yaratımlarında kullanılan kelimeler ve deyimler eşlik eder.
Sağlanan metin açıklamasını ayrıştırdıktan sonra, Imagen 64 x 64 piksellik bir görüntü oluşturur, ardından iki kademeli iyileştirme gerçekleştirir ve görüntüyü daha büyük 1024 x 1024 piksel boyutuna dönüştürür.