SberBank ekibi, tescilli sinir ağının yeni bir versiyonunu sundu. Basın servisinde belirtildiği gibi, güncellenmiş ineratif olmayan model Kandinsky 2.1, “doğal” dilde metin açıklamalarına göre birkaç saniye içinde yüksek kaliteli görüntüler oluşturma yeteneğine sahiptir.
Sinir ağı ayrıca birkaç çizimi karıştırabilir, bir metin açıklamasına göre değiştirebilir, verilene benzer görüntüler oluşturabilir, resmin eksik kısımlarını tamamlayabilir ve sonsuz tuval modunda görüntüler oluşturabilir. Model, 101 dildeki (Rusça ve İngilizce dahil) istekleri anlar ve çeşitli stillerde çizim yapabilir.
Sber’in açıklaması şöyle:
Şimdi sıra sizde – yapay zekadan sizin için bir şaheser yaratmasını isteyin. @kandinsky21_bot’a bir metin açıklaması girin veya sesli bir talepte bulunun. Bunu yapmak için Sber akıllı cihazlarda ve Salyut Android uygulamasında Salut asistanına “Sanatçıyı başlat” deyin.
Yeni Kandinsky 2.1 modeli ayrıca 170 milyon yüksek çözünürlüklü metin-resim çifti üzerinde eğitildi. Ardından, ayrı ayrı bir araya getirilmiş iki milyon çift yüksek kaliteli görüntü seti üzerinde eğitim aldı. Bu set, metinler ve insanların yüzleri gibi sinir ağları için geleneksel olarak zor olan alanlarda açıklamalı resimler içerir. Sonuç olarak Kandinsky 2.1, Kandinsky 2.0’daki 2 milyar yerine 3.3 milyar parametre içerir.