OpenAI, AI devinin şaşırtıcı derecede gerçekçi içerik oluşturabilen Sora adlı ilk metinden videoya modelini ortaya çıkarmasıyla yeni bir çığır açıyor.
Stability AI’den Google’a kadar pek çok rakibi onları geride bıraktığından, şirketin nihayet kendi video motorunu ne zaman piyasaya süreceğini merak ediyorduk. Belki de OpenAI, uygun bir lansmandan hemen önce işleri halletmek istiyordu. Bu hızla çıktılarının kalitesi çağdaşlarını gölgede bırakabilir. Resmi sayfaya göreSora, tek bir metin isteminden “gerçekçi ve yaratıcı sahneler” oluşturabiliyor; diğer metinden videoya yapay zeka modellerine çok benziyor. Bu motorun farkı arkasındaki teknolojidir.
Gerçekçi içerik
Open AI, yapay zekasının insanların ve nesnelerin “fiziksel dünyada nasıl var olduğunu” anlayabildiğini iddia ediyor. Bu, Sora’ya birden fazla kişinin, farklı hareket türlerinin, yüz ifadelerinin, dokuların ve yüksek miktarda ayrıntıya sahip nesnelerin yer aldığı sahneler oluşturma yeteneği veriyor. Oluşturulan videoların çoğu, diğer AI içeriklerinde görülen plastik görünümden veya kabus gibi formlardan yoksundur; ancak buna daha sonra değineceğiz.
Sora ayrıca çok modülerdir. Kullanıcıların bir videonun temeli olarak hizmet verecek hareketsiz bir görüntü yükleyebilecekleri bildiriliyor. Resmin içindeki içerik, küçük ayrıntılara büyük önem verilerek canlandırılacaktır. Hatta önceden var olan bir videoyu alıp “genişletebilir veya eksik kareleri doldurabilir.”
Komut istemi: Karda oynayan bir grup Golden Retriever yavrusu. Başları karla kaplı bir şekilde dışarı çıkıyor. pic.twitter.com/G1qhJRV9tg15 Şubat 2024
Örnek klipleri OpenAI’nin web sitesinde ve X’te (eski adıyla Twitter olarak bilinen platform) bulabilirsiniz. Favorilerimizden biri karda oynayan bir grup köpek yavrusunu içeriyor. Yakından bakarsanız kürklerinin ve burunlarındaki karın çarpıcı derecede gerçekçi bir kaliteye sahip olduğunu görebilirsiniz. Harika bir klip daha Victoria taçlı bir güvercinin gerçek bir kuş gibi ortalıkta sallandığını gösteriyor.
Devam eden bir çalışma
Bu iki video ne kadar etkileyici olsa da Sora mükemmel değil. OpenAI, “modelinin zayıf yönleri olduğunu” kabul ediyor. Bir nesnenin fiziğini simüle etmekte zorlanabilir, sol ile sağı karıştırabilir ve “sebep-sonuç örneklerini” yanlış anlayabilir. Bir AI karakterinin bir çerezi ısırmasını sağlayabilirsiniz, ancak çerezde bir ısırık izi yoktur.
Çok tuhaf hatalar da yapıyor. En komik kazalardan biri Bir grup arkeologun büyük bir kağıt parçasını ortaya çıkarmasını ve bu parçanın sandalyeye dönüşmesini ve ardından buruşmuş bir plastik parçasına dönüşmesini içeriyor. Yapay zekanın kelimelerle de sorunu var gibi görünüyor. “Otter”, “Oter” olarak yanlış yazılmıştır ve “Land Rover” artık “Danover” olarak değiştirilmiştir.
sora hataları bile büyüleyici pic.twitter.com/OvPSbaa0L915 Şubat 2024
İleriye dönük olarak şirket, “kritik alanları zararlar veya riskler açısından değerlendirmek” amacıyla bir grup endüstri uzmanından oluşan “kırmızı ekip üyeleriyle” birlikte çalışacak. Sora’nın yanlış bilgi, nefret dolu içerik üretmediğinden veya herhangi bir önyargıya sahip olmadığından emin olmak istiyorlar. Ek olarak OpenAI, politikalarını ihlal eden istemleri reddetmek için bir metin sınıflandırıcı uygulayacak. Bunlar, diğer şeylerin yanı sıra cinsel içerik, şiddet içeren videolar ve ünlülerin benzerliklerini talep eden girdileri içerir.
Sora’nın resmi olarak ne zaman yayınlanacağına dair bir bilgi yok. Yayınla ilgili bilgi almak için iletişime geçtik. Bu hikaye daha sonra güncellenecektir. Bu arada TechRadar’ın 2024’ün en iyi AI video editörleri listesine göz atın.