Ne bilmek istiyorsun
- Koreli bilim insanları yakın zamanda KOALA adı verilen yeni bir yapay zeka görüntü oluşturma modeli geliştirdiler.
- Microsoft’un Designer’dan Image Creator gibi diğer modellerinin aksine, araç daha yüksek görüntü oluşturma hızlarına sahiptir.
- Stable Diffusion XL adı verilen açık kaynaklı bir görüntü oluşturma aracının boyutunu sıkıştıran, bilgi damıtma adı verilen yeni bir teknikten yararlanıyor.
- Bu şekilde, eski GPU’lara sahip eski PC’lerde bile görüntüleri daha hızlı oluşturabilir.
Yeni bir AI destekli görüntü oluşturucu ufukta görünüyor ve potansiyel olarak Microsoft’un Designer’dan Görüntü Oluşturucusu (eski adıyla Bing Image Creator), Midjourney ve OpenAI’nin DALL-E 3 modelini devralabilir.
Yeni araç, ortalama görüntü oluşturma aracınızdan önemli ölçüde daha hızlı, iki saniyeden daha kısa sürede görüntüler oluşturabilir. Bir noktaya göre Canlı BilimBu yeni buluşun arkasındaki Güney Koreli bilim insanları, Stable Diffusion XL adı verilen açık kaynaklı bir görüntü oluşturma aracının boyutunu sıkıştıran, bilgi damıtma adı verilen yeni bir teknikten yararlandı.
Bağlam açısından Stable Diffusion XL’de 2,56 milyara kadar parametre bulunur. Bildiğiniz gibi yapay zeka, eğitim için görseller de dahil olmak üzere mevcut içeriğe büyük ölçüde güveniyor. Bu geniş parametre kümesi, görüntü oluşturmanın neden biraz zaman alabileceğini açıklıyor. Ancak bu yeni teknikle bilim insanları, en küçük modeli olan KOALA’nın parametrelerini 700 milyona düşürdü.
Bu nedenle araç, görüntüleri saniyeler içinde oluşturabiliyor. Görüntü oluşturma modelinin sorunsuz çalışması için üst düzey GPU’lara ve gelişmiş cihazlara gerek yoktur. Görüntü oluşturmak için yalnızca yaklaşık 8 GB RAM gerekir. Temel olarak bilgi damıtma tekniği, kaliteyi veya performansı etkilemeden bilgiyi büyük modelden küçüğe doğru süzer. Bu şekilde, daha küçük olan model, kaliteli görüntüleri daha hızlı oluşturma kapasitesine sahiptir.
İLGİLİ: Microsoft’un Image Creator’ın görüntü oluşturma hızı dayanılmaz derecede acı verici
Buna göre bilim adamlarının paylaştığı kriterlerKOALA, OpenAI’nin DALL-E 3 veya DALL-E 2 modellerinden önemli ölçüde daha hızlıdır. “Mars’ta ayın altında kitap okuyan bir astronotun resmini” oluşturmanız istendiğinde, ilki 13,7 saniye, ikincisi ise 12,3 saniye sürdü. KOALA’nın görüntüyü oluşturması yalnızca 1,6 saniye sürdü.
KOALA’nın beş versiyonu var. Modelin üç versiyonu metin komutlarına dayalı görseller üretirken geri kalan iki versiyon (Ko-LLaVA) hem görsel hem de video üretebiliyor (OpenAI’nin Sora modeline çok benziyor).
Elektronik ve Telekomünikasyon Araştırma Enstitüsü’nden (ETRI) Koreli bilim adamları, çalışmalarını ve bulgularını açık kaynaklı yapay zeka deposunda paylaştılar Sarılma Yüz ve arXiv veritabanı.
Bilim insanları bu modelleri mevcut görüntü oluşturma hizmetlerine, içerik üretimine ve daha fazlasına entegre etmeyi amaçlıyor.