Google, belirli bir metin açıklamasına dayalı bir görüntü oluşturucu olan Imagen adlı yeni projesini tanıttı.



Geliştiricilere göre, Imagen sinir ağı, başka bir AI destekli görüntü üreticisi olan OpenAI’den DALL-E 2’den daha iyi performans gösteriyor. Şu anda Imagen halka açık değil, ancak sergilenen örnekler etkileyici.

Google Imagen Sinir Ağı, Metin Açıklamalarından Çılgın Fotogerçekçi Görüntüler Oluşturuyor

Google’a göre, yeni metinden görüntüye modeli, “benzeri görülmemiş derecede bir fotogerçekçilik ve derin bir dil anlayışı” ile karakterize ediliyor.

Google Imagen Sinir Ağı, Metin Açıklamalarından Çılgın Fotogerçekçi Görüntüler Oluşturuyor

Google, basit çizimlerden yağlı boya tablolara ve bilgisayar grafiklerine kadar çeşitli stiller içeren Imagen’in çalışmalarının resimlerini ve örneklerini sağladı. Bunlara, yaratımlarında kullanılan kelimeler ve deyimler eşlik eder.

Sağlanan metin açıklamasını ayrıştırdıktan sonra, Imagen 64 x 64 piksellik bir görüntü oluşturur, ardından iki kademeli iyileştirme gerçekleştirir ve görüntüyü daha büyük 1024 x 1024 piksel boyutuna dönüştürür.



genel-22