Google, yeni Lumiere AI video oluşturucunun çarpıcı klipler oluşturmak için alanı ve zamanı birlikte kullandığını iddia ediyor

Google, yeni bir yapay zeka video modeli başlattı Lumiere tam bir video klipte tutarlı, pürüzsüz ve gerçekçi hareketler oluşturabileceğini iddia ediyor.

Mevcut AI video modellerinin çoğu, hareketin tutarlılığı konusunda zorluk yaşıyor ve doğal bir yürüyüş yakalamayı başarsalar bile, diğer unsurlar dalgalı olacak veya manzarayla birleşecek.

Lumiere video oluşturmaya farklı bir yaklaşım getiriyor. Tek tek kareleri bir araya getirmek yerine, nesnelerin yerleşimini ve hareketlerini aynı anda ele alarak videonun tamamını tek bir süreçte oluşturuyor.

Önizleme klipleri etkileyici görünse de, bu sadece bir araştırma projesi olduğu için kendiniz denemeniz mümkün değil. Bununla birlikte, AI videosuna yönelik temel teknoloji ve yaklaşım, kendisini gelecekteki bir Google ürününe entegre edilmiş halde bulabilir ve bu alanda önemli bir oyuncu olabilir.

Lumiere nasıl çalışır?

Lumier, metinden videoya ve görüntüden videoya çalışarak, videodaki bir öğenin tam olarak nasıl görüneceğine ince ayar yapmak için referans görüntüden stilize edilmiş bir oluşturma olanağı sunuyor. Bunlardan bazıları Runway ve Pika Labs modelleriyle zaten mümkün.

Bu yapay zeka modeli bir uzay-zaman mimarisi üzerine inşa edilmiştir ve bu bir bilim kurgu filminden fırlamış gibi görünse de gerçekte hareket ve konumun tüm yönlerini dikkate aldığı anlamına gelir.

Oluşturma sürecinde model, nesnelerin nereye yerleştirilmesi gerektiğini veya klibin “uzay” yönünün yanı sıra nesnelerin ne zaman ve nasıl hareket ettiğini veya “zaman” unsurunu da inceliyor. Tutarlı hareket oluşturmak için her iki yönü de tek bir geçişte aynı anda gerçekleştirir.

Araştırmacılar şöyle yazdı: ön baskı kağıdı modunda: “Modelimiz, tam kare hızında, düşük çözünürlüklü bir videoyu birden fazla uzay-zaman ölçeğinde işleyerek doğrudan oluşturmayı öğreniyor.”

Lumiere başka ne yapabilir?

Üretken yapay zeka videosu ilk ortaya çıkmaya başladığında öncelikli odak noktası kısa bir video klip oluşturmaktı ancak teknoloji olgunlaştıkça diğer özellikler de ortaya çıkmaya başlıyor. Runway, bir görüntünün farklı bölgelerini vurgulama ve bunların bağımsız olarak canlandırılmasını sağlama yeteneği sunar.

Google Araştırma ekibi, Lumier’in “metinden videoya dönüştürmede son teknoloji sonuçlar” elde ettiğini ve “çok çeşitli içerik oluşturma görevlerini ve video düzenleme uygulamalarını kolaylaştırdığını” söylüyor.

Daha yumuşak hareket vaadinin yanı sıra, görüntünün belirli bölgelerini göreceli olarak kolaylıkla canlandırabildiğini ve bir çerçeve içinde yer alan kıyafet tarzını veya hayvan türünü değiştirmek gibi iç boyama yetenekleri sunabildiğini söylüyorlar.

Lumiere’i gerçek dünyada görme ihtimalimiz var mı?

(Resim kredisi: Google Araştırması)

Google, Microsoft ve Meta gibi şirketlerin ortaya koyduğu pek çok araştırma projesi, ön izleme formunda gün yüzüne çıkmıyor. Bununla birlikte, temeldeki teknoloji kendisini markalı ürünlere dahil edilmiş halde buluyor.

Bu, Google’ın ilk yapay zeka video aracı bile değil. Bunun video versiyonu var Resim Google Cloud’da AI görüntü oluşturmayı destekleyen model ve VideoŞair Sıfır çekimli video üretimi için geniş bir dil modelidir.

Video Şairi ayrıca kılavuz olarak metne ihtiyaç duymadan bir video klipten ses oluşturdu. Google, Video Şairi modelinin aynı zamanda güçlü nesne kimliğine sahip herhangi bir süreye sahip bir video üretmek için sürekli olarak bir saniyelik uzantılar oluşturabildiğini söylüyor. Bu aynı zamanda şu anda halka açık değildir.

Lumiere’yi gerçek dünyada görüp göremeyeceğiz sorusunun cevabı, araştırmacılar tarafından ne kadar iyi karşılandığı ve Google’ın dahil edilmeye değer bir projesinin olup olmadığıyla alakalı. Imagen gibi, büyük ölçüde Google Cloud kullanan üçüncü taraf geliştiricilere ayrılmış olabilir.

Tom’s Guide’dan daha fazlası

Ultrabook Dizüstü Bilgisayarlara Geri Dön

Daha fazla fırsat yükle

genel-26

Byteknomers

By teknomers

Benzer İçerikler

Apple, iPad 10 ile Aynı Özellik Setine Sahip Yeni Nesil Giriş Seviyesi iPad’in Fiyatını Düşürmek İstiyor

Yeni iPhone 16 sızıntısı kamera değişikliklerini ve yeni MagSafe şarj cihazını ortaya çıkardı

V Tam lansmandan iki gün önce çevrimdışı olacak

Citizen’in Çarpıcı Star Wars Saat Koleksiyonu Amazon’da %50’nin Üzerinde İndirimde

Helldivers 2 İncelemesi PSN Hesabı Bağlama Gereksinimi Sonrasında Steam’de Bombalandı, Arrowhead Çözüm İçin PlayStation ile Görüşüyor

Hellblade II’nin PC Gereksinimleri Açıklandı

Sızıntıya göre RTX 5090, Nvidia’nın 2024 için tek umudu

Sony Xperia 1 VI ve Xperia 10 VI’nın resmi fotoğrafları sızdırıldı

Sıcak VTOMAN FlashSpeed 1000, bu efsanevi Amazon anlaşmasıyla yarı yarıya indirimli

Samsung Galaxy S22 için One UI 6.1’in kullanıma sunulması muhtemelen önyükleme sorunları nedeniyle beklemede

Spotify’ın kayıpsız sesinin çok yakında geleceği söyleniyor… yine

Düğüm Teorisi ile Gezegensel Yolların Kilidini Açmak

SpaceX Crew Dragon Yeni Limana Taşınıyor, Uzay İstasyonunda Boeing Starliner’a Yer Açıyor

Çin, ayın daha az keşfedilen uzak tarafından örnekler almak için bir sonda gönderdi

Eta Aquariid Meteor Yağmuru, Kırmızı Dev Yıldız Antares ve Mayıs Gezegenleri

İlginizi Çekebilir

Helldivers 2, Steam oyuncularının bir PSN hesabına bağlanmasını gerektirecek

Vivo V30e İlk İzlenimler: Benzer Tasarım, Yeni Kamera

RTX 4080 Super ve Core i9-14900KF özellikli bu Alienware Aurora R16’da 500 $ indirim kazanın

Apple, iPad 10 ile Aynı Özellik Setine Sahip Yeni Nesil Giriş Seviyesi iPad’in Fiyatını Düşürmek İstiyor