OpenAI’nin yeni Sora metinden videoya dönüştürme aracı bu yılın sonlarına kadar kamuya açık olmayacak, ancak bu arada neler yapabileceğine dair bazı cezbedici bakışlar sunuyor – TED’in neler yapabileceğini gösteren akıl almaz yeni bir video (aşağıda) dahil Görüşmeler 40 yıl sonra gibi görünebilir.
TED Talks, FPV drone tarzı videoyu oluşturmak için OpenAI ve Şubat ayından bu yana Sora’yı kullanan film yapımcısı Paul Trillo ile çalıştı. Sonuç, fütüristik konferans konuşmalarının, tuhaf laboratuvarların ve su altı tünellerinin biraz şaşırtıcı da olsa etkileyici bir geçişidir.
Video bir kez daha OpenAI Sora’nın inanılmaz potansiyelini ve sınırlamalarını gösteriyor. FPV drone tarzı efekt, etkileyici sosyal medya videoları için popüler bir efekt haline geldi, ancak geleneksel olarak gelişmiş drone pilotluk becerileri ve yeni DJI Avata 2’nin çok ötesine geçen pahalı bir kit gerektiriyor.
Sora’nın yeni videosu, bu tür efektlerin potansiyel olarak çok daha düşük bir maliyetle yeni yaratıcılara açılabileceğini gösteriyor; ancak bu, OpenAI’nin yeni aracının kendisinin ne kadara mal olacağını ve kime mal olacağını henüz bilmediğimiz uyarısını da beraberinde getiriyor. için mevcut olmak.
TED 40 yıl sonra nasıl görünecek? #TED2024 için, yayınlanmamış metinden videoya modeli Sora’yı kullanarak bu özel videoyu oluşturmak için sanatçı @PaulTrillo ve @OpenAI ile birlikte çalıştık. Daha fazla çığır açan yapay zeka için bizi izlemeye devam edin — çok yakında https://t.co/YLcO5Ju923 adresinde! pic.twitter.com/lTHhcUm4Fi19 Nisan 2024
Ancak video (yukarıda) aynı zamanda Sora’nın tam kapsamlı filmler için güvenilir bir araç olma konusunda hala oldukça yetersiz olduğunu gösteriyor. Çekimlerdeki insanlar yalnızca birkaç saniyeliğine ekranda kalıyor ve arka planda bol miktarda tekinsiz vadi kabusu yakıtı var.
Sonuç, canlandırıcı bir deneyimdir ve aynı zamanda kendinizi tuhaf bir şekilde dengesiz hissetmenize neden olur; tıpkı bir gökyüzü dalışından sonra tekrar yere inmek gibi. Yine de, Sora’nın 2024’ün sonlarında halka açık lansmanına doğru hızla ilerlerken kesinlikle daha fazla örnek görmeyi çok isterim.
Video nasıl yapıldı?
OpenAI ve TED Talks, bu özel videonun nasıl yapıldığına ilişkin ayrıntılara girmedi ancak videonun yaratıcısı Paul Trillo, yakın zamanda Sora’nın alfa testçilerinden biri olma deneyimlerinden daha geniş bir şekilde bahsetti.
Trillo anlattı İşletme İçeriği “bir video oyununa daha az ve daha filmsel bir şeye benzediğinden emin olmak için kullandığım kelimelerden oluşan bir kokteyl” de dahil olmak üzere kullandığı yönlendirme türleri hakkında. Görünüşe göre bunlar arasında “35 milimetre”, “anamorfik mercek” ve “alan derinliği mercek deseni” gibi istemler yer alıyor; bunlar gerekli, aksi takdirde Sora “bu çok dijital görünümlü çıktıyı varsayılan olarak kullanacaktır”.
Şu anda her istemin OpenAI’den geçmesi gerekiyor, böylece telif hakkı gibi konularda sıkı güvenlik önlemlerinden geçilebiliyor. Trillo’nun en ilginç gözlemlerinden biri, Sora’nın şu anda “bir şey istediğiniz, fikirleri birbirine karıştırdığı ve gerçek bir fizik motoruna sahip olmadığı bir kumar makinesi gibi” olduğudur.
Bu, OpenAI’nin daha önce kabul ettiği gibi, insanlar ve nesne durumlarıyla gerçekten tutarlı olmaktan hâlâ çok uzakta olduğu anlamına geliyor. Blog yazısı. OpenAI, Sora’nın “şu anda bir simülatör olarak çok sayıda sınırlama sergilediğini” söyledi; bunlara “cam kırılması gibi birçok temel etkileşimin fiziğini doğru bir şekilde modellememesi” de dahil.
Bu tutarsızlıklar muhtemelen Sora’yı bir süreliğine kısa biçimli bir video aracı olarak sınırlayacak, ancak yine de denemek için sabırsızlandığım bir araç.