OpenAI Sora’nın ilk sürümü, süper kahramanlar, şehir manzaraları, animasyonlu köpek yavruları gibi ona attığınız hemen hemen her şeyin videosunu oluşturabilir. Bu, AI video oluşturucu için etkileyici bir ilk adımdır. Ancak gerçek sonuçlar tatmin edici olmaktan çok uzak; pek çok video tuhaflıklar ve tutarsızlıklarla o kadar boğuşuyor ki, herhangi birinin bunlardan faydalanabileceğini hayal etmek zor.
Sora, neredeyse bir yıldır yeteneklerini müjdeleyen tanıtımların ardından Pazartesi günü serbest bırakıldı. Ancak video oluşturma özelliklerine geçmeden önce birkaç engel var. Birincisi, hesap oluşturma, yoğun talep nedeniyle açılıştan birkaç saat sonra kapatıldı. Kaydolmayı başaranlar, özelliklerinin kilidini açmak için ayrıca bir abonelik gerektirdiğini görecekler: Aylık 20 ABD doları değerindeki “Artı” üyeliği, çözünürlüğe bağlı olarak uzunluğu beş veya 10 saniyeyle sınırlı olan 480p veya 720p’de videolar oluşturmanıza olanak tanır. 1080p kalitesi ve 20 saniyelik videolar da dahil olmak üzere her şeyin kilidini açmak için “Pro” Sora aboneliği için ayda 200 ABD doları ödemeniz gerekiyor.
Plus katmanını test etme sonuçlarım çok etkileyiciydi. Sınırlı açıklamalara sahip basit yönlendirmeler en iyi sonucu veriyor gibi görünüyor – örneğin “iplik yumağıyla oynayan bir kedi”, zeminde heyecanla zıplayan çok gerçekçi görünen bir kedi yaratıyor. Ancak Sora, kediye birkaç dakikalığına ikinci bir kuyruk verdi ve ipliğin kendisi de titrekti ve kötü yerleştirilmiş bir CGI gibi görünüyordu.
Bu görsel sorunlar daha sık görülüyordu ve ayrıntılı sahne açıklamaları sağlayan karmaşık yönlendirmeler nedeniyle daha dikkat çekiciydi. İnsan hareketinin uzaktan doğal olmasını sağlamak çok zor: Bana makyaj yapan birini göstermesini istediğimde eller her yere savruluyordu ve insanların salata ve sosisli sandviç yediği videolar kabus gibi bir şekilde anımsatıyordu. Will Smith’in spagetti solumasını gösteren viral yapay zeka klipleri.
Sora, daha uzun videolar için hızlı talimatların düzenlenmesine yardımcı olması beklenen ilginç bir Storyboard özelliği içeriyor. Video düzenleme zaman çizelgesine benziyor ve kullanıcıların videonun tamamı için büyük bir açıklama eklemek yerine Sora’nın her iki saniyede bir ne oluşturmasını istediklerini açıklamalarına olanak tanıyor. Kullanımı yeterince kolay, ancak sonuçlar daha da kötüydü. Ne kadar çok ayrıntı eklediysem, o kadar çok çarpıklık ve tuhaflık ortaya çıktı.
Yine de bazı şeyler beni etkiledi. Video üretimi beklenenden daha hızlıydı; 10 saniye uzunluğundaki klipler bile genellikle 30 saniyenin altındaydı. Kürk ve kumaşlardaki desenler de hızlı hareketlerde bile tutarlı kaldı ve Sora’nın oluşturduğu ışık, gölge ve ayna efektleri gerçeği simüle etme konusunda harika bir iş çıkarıyor. Bir pencereden gelen güneş ışığı, bir parıltı sağlar ve beklediğiniz tüm malzemelerin güzel bir şekilde parlamasına neden olur. Düşük çözünürlüklerde bile çoğu nesne yüksek düzeyde ayrıntıya sahiptir ve pikselli bir karmaşaya dönüşmez.
Tüm hatalarına rağmen Sora, fotogerçekçiliği simüle etmek için en iyi AI video oluşturucularından biri olarak kabul edilen Runway AI’den daha iyi bir iş çıkardı. Her iki platforma da aynı komutlar girildiğinde Sora’nın sonuçları daha gerçekçi görünüyordu ve çok daha az görsel bozulma içeriyordu. Sora’nın çıktılarının kalitesi, Adobe’nin Firefly Video Modelinin Ekim ayında Adobe Max’te gördüğüm demolarıyla aynı seviyede, ancak OpenAI’nin, oluşturulan çıktıların ticari olarak güvenli olduğunu vaat etme avantajından açıkça yoksun olduğu açık. Adobe bunu, AI modellerini yalnızca lisanslı veya kamuya açık içerik üzerinde eğiterek başardı; bu, OpenAI’nin takip etmediği bir yaklaşımdır.
[The above video was generated using Runway.AI using the same prompt I gave Sora.]
Sora’nın sıfırdan ürettiği hiçbir şey aslında kullanılabilirYine de. Anlatı tutarlılığı gerektiren eğlence veya ticari işler için kesinlikle hazır değil ve bunu hızlı bir stok görüntülerin yerine koymak için bile gerçekten ulaşmanız gerekir. Belki de belirgin bir AI tuhaflığı içermeyen yüksek kaliteli videolar elde etmek, yeterli zaman, deneyim ve düzenleme becerileri ile mümkündür; ancak durum buysa, o zaman Sora’nın henüz içerik oluşturmayı büyük ölçüde “demokratikleştirdiği” düşünülemez. .
Ayrıca, telif hakkı ihlalini veya kötü herhangi bir şeyin oluşmasını engellemeyi amaçlayan, ancak değişen başarı düzeylerine sahip çeşitli korkuluklar da mevcuttur. Sora, Donald Trump ve Kamala Harris gibi siyasi figürler yaratma girişimlerini doğrudan engelliyor ve kullanıcıyı bu tür istemlerin OpenAI’nin hizmet şartlarını ihlal edebileceği konusunda uyarıyor. Taylor Swift ve Lewis Hamilton gibi ünlü isimler engellenmiyor, bunun yerine videoya kendileriyle hiçbir benzerliği olmayan rastgele bir kişi eklenecek. “Kırmızı ayakkabılar giyen mavi iki ayaklı çizgi film kirpi” gibi sonuçları zorlamaya çalışan açıklamalarda bile tanınabilir karakterlerden ve marka simgelerinden kaçınmak oldukça iyidir.
Talep ettiğiniz sahneler söz konusu olduğunda işler daha da sarsıcı bir hal alıyor. “Korkmuş protestocuların üzerine doğru giden bir kamyon” gibi bazı şiddet içeren terimler engellendi, ancak sonuçlar gülünç derecede karikatürize olsa bile, Empire State Binası’nda bir patlamanın görüntüsü ortaya çıktı. Ayrıca podyumda mayo modelleyen ve gülümseyen ebeveynlerine silah doğrultan küçük çocukların videoları da üretildi.
Sora, kendi referans görsellerinizi yüklemenize olanak tanıyan bir özellik içerir. Açılan bir mesaj, kullanıcıları, kullanılmadan önce bir dizi kutuyu işaretlemeye zorlayarak, bu görsellerin haklarına sahip olduğunuzu ve reşit olmayanlar, şiddet veya müstehcen temalar içeren herhangi bir şey yüklemeyeceğinizi veya hesabınızın askıya alınması riskiyle karşı karşıya kalacağınızı taahhüt eder. veya “geri ödeme yapılmadan” yasaklandı. Ancak özelliğin kötüye kullanılmasını engelleyen en büyük engel finansaldır; yalnızca Pro düzeyinde aboneliğe sahip kullanıcılar, içinde kişilerin yer aldığı görselleri yükleyebilir. Gördüğümüz daha etkileyici Sora demolarını oluşturmak için kullanılan özellik buysa, bu önemli bir sınırlamadır.
Henüz ilk günler ve çözülmesi gereken bazı bariz sorunlar var, ancak şu ana kadar gördüğüm hiçbir şey bana Sora’nın bir gecede video prodüksiyonunda devrim yaratacağını düşündürmüyor. Yüksek kaliteli çıktılar oluşturmaya yönelik özellikler, geleneksel film çekme ve video oluşturma araçları kadar pahalı olan bir aboneliğin arkasında kilitlenmiştir ve bu da onu birçok kişi için erişilemez hale getirmektedir. Şu anki haliyle bu teknolojiyi kullanarak izlemesi gerçekten keyifli olacak bir filmin tamamının üretildiğini hayal etmek zor.
Ancak kalite sorunları, insanların yapay zeka video araçlarının sağladığı kolaylıklardan halihazırda kâr elde etmeye çalışmasını engellemedi — YouTube zaten yapay zeka tarafından oluşturulan saçma sapan içeriklere doymuş durumda küçük çocuklara yöneliktir. Sora şu anda benzer içerikleri seri olarak üretme konusunda fazlasıyla yetenekli ve bunu yapmak size ayda yalnızca 20 dolara mal olacak.

