Uluslararası yapay zeka konferansı Yapay Zeka Yolculuğu’nda Sber, bu yılın Haziran ayında piyasaya sürülen Kandinsky sinir ağının geliştirilmiş bir versiyonu olan Kandinsky 2.0’ı sundu. Yaratıcılara göre bu, 2 milyar parametreli bir metin açıklamasından görüntüler oluşturmak için ilk Rus çok dilli difüzyon modelidir. Kandinsky 2.0, selefinden farklı olarak, istekleri 101 dilde işleyebilir ve geliştiricilere göre, hangi dilin kullanıldığına bakılmaksızın eşit derecede hızlı ve verimli bir şekilde yapar – örneğin Rusça ve İngilizce gibi yaygın veya nadir, Moğolca.


Kandinsky 2.0, metinsel bir tanımdan (görüntü, video, 3B ve ses sentezi) multimedya içeriği oluşturmanın hemen hemen tüm görevlerinde iyi sonuçlar veren, giderek daha popüler hale gelen yayılma yaklaşımını kullanır. Sber’e göre Kandinsky 2.0, öncekinden daha zengin, daha derin ve daha gerçekçi bir resim ve gelişmiş özelliklerle ayrılıyor. FusionBrain web sitesinde, Rönesans, Klasisizm, Animasyon, Yeni Yıl ve hatta Khokhloma dahil olmak üzere 20 farklı stilde görüntüler oluşturulabilir. Model ayrıca iç boyama işlevlerini (görüntünün herhangi bir bölümünü ve görüntüdeki herhangi bir nesneyi sinir ağı tarafından oluşturulanlarla değiştirme) ve dış boyama (bitmiş görüntüyü ve görüntünün etrafındaki arka planı bitirme yeteneği) uygular. Kandinsky 2.0’ın aynı kavramları farklı dillerde farklı şekillerde çizmesi ilginçtir: örneğin, “ulusal yemek” sorgusunu Rusça olarak formüle ederseniz, büyük olasılıkla shchi ve Japonca – miso çorbası ve suşi olacaktır.

Kandinsky yabancı dilleri anlamayı öğrendi

Sinir ağı, AIRI Yapay Zeka Enstitüsü’nden bilim adamlarının desteğiyle Sber AI araştırmacıları tarafından geliştirildi ve eğitildi. FusionBrain web sitesinde, Sber akıllı cihazlarında ve Salyut mobil uygulamasında “Sanatçıyı Başlat” komutunu nasıl kullandığını görebilirsiniz. Kandinsky 2.0’ın yaratıcılarının not ettiği gibi, birkaç saniye içinde belirli bir görev için benzersiz bir görüntü elde etmenize ve onu lisans olmadan ücretsiz olarak dağıtmanıza olanak tanır ki bu iş için çok önemlidir. Onlara göre sinir ağı, insanlar tarafından oluşturulanlardan genellikle ayırt edilemeyen gerçekçi görüntüler çiziyor.



genel-22