Google I/O 2024’ün açılış oturumu, şirketin yapay zekaya (AI) odaklanan birçok önemli duyuru yaptığı 112 dakikalık bir etkinlikti. Duyurular, yeni yapay zeka modellerinden yapay zekanın Google ürünlerine entegrasyonuna kadar uzanıyordu ancak belki de en ilgi çekici tanıtımlardan biri, 1080p çözünürlükte videolar oluşturabilen, yapay zeka destekli bir video oluşturma modeli olan Veo’ydu. Teknoloji devi, yapay zeka aracının bir dakikalık sınırı aşan videolar oluşturabileceğini söyledi. Özellikle OpenAI, Şubat ayında Sora adlı video AI modelini de açıkladı.

Etkinlik sırasında Google DeepMind’ın kurucu ortağı ve CEO’su Demis Hassabis, açıklanmış Veo. Yapay zeka modelini duyururken şunları söyledi: “Bugün, Veo adlı en yeni ve en yetenekli üretken video modelimizi duyurmaktan heyecan duyuyorum. Veo, metin, resim ve video istemlerinden yüksek kaliteli 1080p videolar oluşturur. Talimatlarınızın ayrıntılarını farklı görsel ve sinematik tarzlarda yakalayabilir.”

Teknoloji devi, Veo’nun bir cümlenin nüansını ve tonunu anlamak için istemleri yakından takip edebildiğini ve ardından buna benzer bir video oluşturabildiğini iddia ediyor. Yapay zeka modeli, hızlandırılmış çekim, yakın çekimler, hızlı çekimler, hava çekimleri ve çeşitli ışıklandırma ve alan derinliği çekimleri gibi farklı stillerde videolar üretebilir. AI modeli, video oluşturmanın yanı sıra, kullanıcı kendisine bir başlangıç ​​videosu sağladığında ve bir şey ekleme veya kaldırma isteminde bulunduğunda videoları da düzenleyebilir. Ayrıca, tek bir istem yoluyla veya birden fazla ardışık istem yoluyla bir dakikalık sınırın ötesinde videolar da üretebilir.

Video oluşturma modellerindeki tutarlılık sorununu çözmek için Veo, gizli yayılma transformatörlerini kullanır. Bu, karakterlerin, nesnelerin veya tüm sahnenin kareler arasında beklenmedik şekilde titremesi, atlaması veya geçiş yapması gibi durumların azaltılmasına yardımcı olur. Google, Veo tarafından oluşturulan videoların, yapay zeka tarafından oluşturulan içeriğin filigranlanması ve tanımlanması için şirketin şirket içi aracı olan SynthID kullanılarak filigranlanacağını vurguladı. Model yakında Google Labs’taki VideoFX aracı aracılığıyla seçkin içerik oluşturucuların kullanımına sunulacak.

Veo’nun OpenAI’nin Sora’sıyla benzerlikleri

Yapay zeka modellerinin hiçbiri henüz halka açık olmasa da her ikisi de bazı benzerlikleri paylaşıyor. Veo, bir dakikayı aşabilecek bir süre boyunca 1080p videolar üretebilirken OpenAI’nin Sora’sı 60 saniyeye kadar videolar üretebilir. Her iki model de metin istemlerinden, resimlerden ve videolardan videolar oluşturabilir. Yayılma modellerine dayalı olarak her ikisi de birden fazla çekimden, stilden ve sinematografi tekniklerinden videolar üretme yeteneğine sahiptir. Hem Sora hem de Veo ayrıca yapay zeka tarafından oluşturulan içerik etiketleriyle birlikte gelir. Sora, Coalition for Content Provenance and Authenticity (C2PA) standardını kullanırken Veo kendi yerel SynthID’sini kullanıyor.


Bağlı kuruluş bağlantıları otomatik olarak oluşturulabilir; ayrıntılar için etik bildirimimize bakın.



genel-8