OpenAI, Sora’nın piyasaya sürülmesiyle neredeyse bir yıl boyunca dalga geçti ve defalarca erteledi. Salı günü, şirket nihayet yeni video oluşturma modelinin kamu kullanımına yönelik tamamen işlevsel bir versiyonunu açıkladı ve ilk söylentilere rağmen, sürümün giderek daha fazla ilk kullanıcısı pek etkilenmiş görünmüyor. Ve ben de değilim.
Metinden videoya modelimiz Sora ile tanışın.
Sora, son derece ayrıntılı sahneler, karmaşık kamera hareketleri ve canlı duygulara sahip birden fazla karakter içeren 60 saniyeye kadar videolar oluşturabiliyor. https://t.co/7j2JN27M3W
Komut istemi: “Güzel, karlı… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) 15 Şubat 2024
Şirket, Sora’yı ilk kez geçtiğimiz Şubat ayında hipergerçekçi video görselleştirmeleriyle eleştirmenlerin beğenisine sunmuştu. OpenAI o zamanki duyuru blogunda “Sora, görsel kaliteyi ve kullanıcının isteklerine bağlılığı korurken bir dakikaya kadar videolar üretebiliyor” diye yazmıştı. “Model, yalnızca kullanıcının istemde ne istediğini değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduğunu da anlıyor.”
OpenAI daha fazla çılgın Sora videosu yayınlamaya devam ediyor
Bunlar %100 yapay zeka tarafından oluşturulmuştur
9 gerçeği bükme videosu
1. Yapraklardan yapılmış fil pic.twitter.com/tPsHNGbFPS
— Linus Ekenstam (@LinusEkenstam) 18 Mart 2024
Şirket, Mart ayında, bu kez yapraklardan yapılmış bir filin yer aldığı, Sora’nın ürettiği daha fazla görüntü yayınladı ve modelin yeteneklerini daha da öne çıkardı. Sora programı daha sonra bir dizi geliştirme gecikmesiyle karşılaştı ve OpenAI’nin baş ürün sorumlusu Kevin Weil yakın zamanda bunu suçladı. Reddit AMA “Modeli mükemmelleştirme, güvenliği/kimliğe bürünmeyi/diğer şeyleri doğru yapma ve hesaplamayı ölçeklendirme ihtiyacı” üzerine. Aynı zamanda Bilgi Sora’nın ilk yinelemelerinin düşük performanstan muzdarip olduğunu ve kullanıcının istemlerine odaklanmayı sürdürmekte zorlandığını, bir dakikalık bir klip oluşturmak için gerçek dünyada 10 dakikaya kadar zaman gerektiğini bildirdi. Model yakın zamanda OpenAI’nin “sanat yıkama” uygulamalarına itiraz eden bir grup hoşnutsuz beta testçisi tarafından çevrimiçi olarak sızdırıldı, ancak şirket buna yanıt olarak grubun izinsiz kullanıcı arayüzünü Hugging Face’ten hızla kaldırdı.
OpenAI, Sora’nın performansını ayarlayıp iyileştirirken, şirketin rekabeti de öğle yemeğini yiyordu. Adobe’nin Firefly AI’sı, Runway’in Gen 3 Alpha’sı, Meta’nın Movie Gen’i ve Kuaishou Technology’nin Kling’i (sayısız ücretsiz kullanım seçeneğinden bahsetmiyorum bile) geçtiğimiz yıl internette hızla çoğaldı ve pek çoğu, öncekilere göre üstün kalitede klipler ve daha hızlı çıkarım süreleri sunuyordu. OpenAI defalarca söz vermişti.
Salı günü OpenAI, Sora’nın üretime hazır versiyonunu resmi olarak tanıttı ve onu ayda 20 ABD Doları Plus ve ayda 200 ABD Doları (lol) Pro abonelerine sundu. Veya en azından şirket birkaç saatliğine bunu yaptı. Teknoloji yorumcusu Ed Zitron olarak Bluesky Çarşamba günü not edildi“Sora’nın oyundan çıktığını söyledikten sadece birkaç saat sonra, hatta belki daha da kısa bir sürede OpenAI, net bir zaman çizelgesi olmaksızın yeni hesap kayıtlarını kabul etmeyi bıraktı. OpenAI tüm teknoloji medyasını yemledi ve değiştirdi. Bu şirketin video oluşturucuyu halka açık hale getirmeyi göze alması mümkün değil.”
Erişim sağlamayı başaranlar için Sora’nın oluşturmayı başardığı videolar pek de etkileyici değildi. YouTube yıldızı Marques Brownlee’nin modelle ilgili uygulamalı videosu sırasında belirttiği gibi, 20 saniye uzunluğunda 1080p çözünürlükte tek bir klip oluşturmak birkaç dakika sürdü ve bir deneğin bacaklarını ve ön ve arka hareketlerini oluşturmada önemli zorluklar yaşandı. arka bacaklar klip boyunca doğal olmayan bir şekilde yer değiştiriyor. Ne demek istediğini anlamak için bir jimnastikçinin minderin üzerinde yuvarlanırken kollarını, bacaklarını ve kafasını anında değiştirdiği aşağıdaki oluşturulan videoya bakmak yeterlidir.
işte Sora’nın hazırladığı jimnastik videosu
— Peter Labuza (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z
Jimnastik videosunu yayınlayan Bluesky kullanıcısı Peter Labuza, modele yönelik eleştirilerinden geri durmadı, belirterek: “Üzgünüm ama bir metin-video oluşturucu yaparsanız ve ona “bir kedinin tarlada koşmasını sağlayın” derseniz Ve Ona başlangıç görüntüsünü veriyorsunuz ve kedi sadece duruyor, jeneratörünüz çalışmıyor.”
Bluesky kullanıcısı Chris Offner da benzer bir görüşe sahipti ve alaycı bir şekilde “Sora’nın veri odaklı bir fizik motoru olduğunu” belirterek, bilinen fizik yasalarının hepsine olmasa da çoğuna meydan okuyan bir kayakçının kesinlikle çılgın bir klibini paylaşıyordu.
eşik ayrıca modeli denedi ve “ek uzuvlar veya çarpık nesneler” gibi göze hoş görünmeyen eklentilerden hâlâ kaçınamadığından yakınıyordu.
“Sora veriye dayalı bir fizik motorudur.”x.com/chrisoffner3…
— Chris Offner (@chrisoffner3d.bsky.social) 2024-12-10T12:42:53.674Z
Herkes Sora’dan ilk bakışta nefret etmiyordu, kusura bakmayın. X kullanıcısı Nathan Shipley, modelin, kullanıcıların oluşturulan videoyu yüklenen bir örnekteki nesnelerin hareketlerine göre maskelemelerine olanak tanıyan “remiks” özelliğini gösterdi. Bu durumda, kendisi tutarken videoya çektiği bir makasla aynı şekilde oluşturulan bir vincin kafasını hareket ettirdi.
Sora Remix testi: Vince makas
Soru şuydu: “Bir göletin kenarında güzel bir doğa manzarasının etrafına bakan meraklı bir turna kuşunun yakından görünümü. Kuşun kafası karenin içine girip çıkıyor.” pic.twitter.com/CvAkdkmFBQ
— Nathan Shipley (@CitizenPlain) 10 Aralık 2024
Şirketin ilgilenen Sora kullanıcıları için hesap kayıtlarını ne zaman güvenilir bir şekilde yeniden açabileceğine dair henüz bir bilgi yok. Runway’in yakın zamanda yaptığı gibi, OpenAI’nin Hollywood’u Sora ile şu anki haliyle kur yapıp yapamayacağı 3. Nesil ve Lionsgateayrıca görülmeye devam ediyor.
Kesin olan bir şey var ki, OpenAI, AI patlamasındaki ilk liderliğine rağmen, sektörün geri kalanı tarafından hızla geride bırakılıyor ve az önce Sora’da gördüğümüz gibi cansız ürün sürümleri, şirketin itibarına yalnızca daha fazla zarar verecek.


