Google, sinir ağlarıyla ilgili trende ayak uydurmaya karar verdi. Imagen Video adlı yeni sistemi, metinsel açıklamalardan ve oldukça yüksek kalitede videolar oluşturur.
Sistem, 1280 x 768 piksel çözünürlükte 5 saniyeye kadar uzunlukta videolar oluşturabilir. şirket, sistemin kaynak kodlarını henüz yayınlamamakta ve şok edici veya müstehcen içerik görünümünden kaçınmak için sisteme erişim açmamaktadır.
Kaynağa göre, yeni sistem farklı tarzlarda çalışabilir. Özellikle, sanatçıların stillerini taklit edebilir ve dönen 3B nesneler oluşturabilir ve onlar döndükçe şekilleri korunur.
Sinir ağı, on milyonlarca fotoğraf, video ve metin açıklaması üzerinde eğitildi. Bir metin talebi gönderildiğinde, sistem 24×48 piksel çözünürlük ve saniyede 3 kare frekans ile 16 karelik bir başlangıç video prototipi oluşturur. Ondan sonra başka bir sistem çözünürlüğü 1280×768 piksele ve 5 saniyeye çıkarıyor.
Çalışmanın sonuçları proje web sitesinde mevcuttur. Ve daha önce, Meta* geliştiricileri, bir metin açıklamasından videolar da oluşturabilen Make-A-Video adlı yeni bir sinir ağı tanıttı.
* Meta, Rusya Federasyonu topraklarında aşırılık yanlısı bir örgüt olarak tanınmaktadır.