ChatGPT yapımcısı OpenAI şimdi açıklandı SoraMetin istemlerini videoya dönüştüren yapay zeka motoru. Dall-E’yi (yine OpenAI tarafından geliştirilmiştir) düşünün, ancak statik görüntüler yerine filmler için.

Sora için henüz çok erken ama yapay zeka modeli halihazırda sosyal medyada çok sayıda kliple çok fazla ses getirmeye başladı; sanki aktörler ve film yapımcılarından oluşan bir ekip tarafından bir araya getirilmiş gibi görünen klipler ortalıkta dolaşıyor.

Burada OpenAI Sora hakkında bilmeniz gereken her şeyi açıklayacağız: neler yapabileceği, nasıl çalıştığı ve onu ne zaman kendiniz kullanabileceğiniz. Artık AI metin istemli film yapımı dönemi geldi.

OpenAI Sora çıkış tarihi ve fiyatı

Şubat 2024’te OpenAI Sora, görevi bir ürünün güvenliğini ve kararlılığını test etmek olan “kırmızı takım çalışanları”nın kullanımına sunuldu. OpenAI ayrıca video oluşturma yeteneklerini test etmek ve geri bildirim sağlamak için seçilmiş sayıda görsel sanatçıyı, tasarımcıyı ve film yapımcısını da davet etti.

“OpenAI dışındaki kişilerle çalışmaya başlamak ve onlardan geri bildirim almak ve halka ufukta hangi AI yeteneklerinin olduğu konusunda fikir vermek için araştırma ilerlememizi erkenden paylaşıyoruz.” OpenAI diyor.

Başka bir deyişle, geri kalanımız henüz onu kullanamıyor. Şimdilik Sora’nın ne zaman daha geniş kitlelere sunulabileceğine veya ona erişmek için ne kadar ödememiz gerekeceğine dair bir gösterge yok.

ChatGPT’de olup bitenlere dayanarak zaman ölçeği hakkında bazı kaba tahminler yapabiliriz. Bu AI sohbet robotu Kasım 2022’de halka sunulmadan önce, o yılın başlarında InstructGPT adlı bir öncül vardı. Ayrıca OpenAI’nin DevDay’i genellikle her yıl Kasım ayında gerçekleşir.

O halde Sora’nın da benzer bir yol izlemesi ve 2024’te benzer bir zamanda piyasaya sürülmesi kesinlikle mümkün. Ancak bu şu anda sadece bir spekülasyon ve Sora’nın çıkışı hakkında daha net bir gösterge alır almaz bu sayfayı güncelleyeceğiz. tarih.

Fiyata gelince, benzer şekilde Sora’nın ne kadara mal olabileceğine dair hiçbir ipucumuz yok. Bir kılavuz olarak, en yeni Büyük Dil Modellerine (LLM’ler) ve Dall-E’ye erişim sunan ChatGPT Plus’ın şu anda aylık maliyeti 20 ABD dolarıdır (yaklaşık 16 £ / 30 AU $).

Ancak Sora, örneğin Dall-E ile tek bir görüntü oluşturmaktan çok daha fazla bilgi işlem gücü talep ediyor ve süreç de daha uzun sürüyor. Dolayısıyla, etkili bir araştırma makalesi olan Sora’nın uygun fiyatlı bir tüketici ürününe ne kadar iyi dönüşebileceği hala tam olarak belli değil.

OpenAI Sora nedir?

Çok miktarda eğitim verisine dayanarak yeni içerik üretebilen, metin için Google Gemini ve görüntüler için Dall-E gibi üretken yapay zeka modellerine aşina olabilirsiniz. Örneğin ChatGPT’den size bir şiir yazmasını isterseniz, alacağınız yanıt, yapay zekanın halihazırda özümsediği ve analiz ettiği çok sayıda şiire dayalı olacaktır.

OpenAI Sora da benzer bir fikir ancak video klipler için. Ona “geceleyin şehrin caddesinde yürüyen kadın” veya “ormanda araba kullanan araba” gibi bir metin mesajı veriyorsunuz ve bir video alıyorsunuz. Yapay zeka görüntü modellerinde olduğu gibi, klibe neyin dahil edilmesi gerektiğini ve görmek istediğiniz çekimin tarzını söyleme konusunda çok spesifik olabilirsiniz.

Bunun nasıl çalıştığına dair daha iyi bir fikir edinmek için, tarafından yayınlanan bazı örnek videolara göz atın. OpenAI CEO’su Sam Altman – Sora’nın dünyaya tanıtılmasından kısa bir süre sonra Altman, sosyal medyada ileri sürülen yönlendirmelere yanıt verdi ve “sivri uçlu bir şapka ve elinden yıldırım fırlatan bir büyü yapan beyaz yıldızların yer aldığı mavi bir cüppe giyen bir büyücü” gibi metinlere dayalı videoları geri verdi. ve diğer elinde eski bir cilt tutuyor”.

OpenAI Sora nasıl çalışır?

Basitleştirilmiş bir düzeyde, Sora’nın arkasındaki teknoloji, web’de bir köpek veya kedinin resimlerini aramanıza olanak tanıyan teknolojiyle aynıdır. Bir yapay zekaya bir köpeğin veya kedinin yeterince fotoğrafını gösterin, böylece aynı desenleri yeni görüntülerde tespit edebilecektir; Aynı şekilde, bir yapay zekayı bir gün batımının veya bir şelalenin milyonlarca videosu üzerinde eğitirseniz, kendi videosunu oluşturabilecektir.

Tabii ki bunun altında çok fazla karmaşıklık var ve OpenAI bunu sağladı. derin bir dalış AI modelinin nasıl çalıştığıyla ilgili. Gerçekçi videoların neye benzediğini bilmek için “internet ölçeğindeki veriler” üzerine eğitiliyor; önce neye baktığını bilmek için klipleri analiz ediyor, ardından istendiğinde kendi versiyonlarını nasıl oluşturacağını öğreniyor.

Bu nedenle, Sora’dan bir akvaryumun videosunu çekmesini isteyin; o, gördüğü tüm akvaryum videolarına dayalı olarak yaklaşık bir tahminle geri gelecektir. Yapay zekanın neyin nereye gitmesi gerektiğini ve bir videonun farklı öğelerinin kare kare nasıl etkileşime girip ilerlemesi gerektiğini anlamasına yardımcı olan görsel yamalar, daha küçük yapı taşları olarak bilinen şeyleri kullanır.

Sora, yapay zekanın ‘gürültülü’ bir yanıtla başladığı ve ardından bir dizi geri bildirim döngüsü ve tahmin hesaplaması yoluyla ‘temiz’ bir çıktıya doğru çalıştığı bir yayılma modeline dayanıyor. Bunu, gösteride oynayan bir köpeğin videosunun anlamsız lekelerden gerçekten gerçekçi görünen bir şeye dönüştüğü yukarıdaki karelerde görebilirsiniz.

Diğer üretken yapay zeka modelleri gibi Sora da transformatör teknolojisini kullanıyor (ChatGPT’deki son T, Transformer anlamına geliyor). Transformers, veri yığınlarını işlemek için çeşitli karmaşık veri analizi teknikleri kullanır; analiz edilen şeyin en önemli ve en az önemli kısımlarını anlayabilir ve bu veri yığınları arasındaki bağlamı ve ilişkileri çözebilirler.

OpenAI’nin eğitim verilerini nereden bulduğunu tam olarak bilmiyoruz; Sora’yı desteklemek için hangi video kitaplıklarının kullanıldığını söylemedi ancak içerik veritabanlarıyla ortaklıkları olduğunu biliyoruz. Shutterstock gibi. Bazı durumlarda şunları yapabilirsiniz: benzerlikleri görün eğitim verileri ile Sora’nın ürettiği çıktı arasında.

OpenAI Sora ile neler yapabilirsiniz?

Şu anda Sora, metin istemlerinden herhangi bir ses eklenmeden bir dakikaya kadar HD videolar üretme kapasitesine sahiptir. Neyin mümkün olduğuna dair bazı örnekler görmek isterseniz, göz atmanız için akıllara durgunluk veren 11 Sora şortunun bir listesini hazırladık; bunlar arasında kabarık Pixar tarzı animasyon karakterleri ve örgü kasklı astronotlar da var.

OpenAI, “Sora, görsel kaliteyi ve kullanıcının isteklerine bağlılığı korurken bir dakikaya kadar uzunlukta videolar oluşturabiliyor” diyor ancak hepsi bu değil. Ayrıca hareketsiz görüntülerden videolar oluşturabilir, mevcut videolardaki eksik kareleri doldurabilir ve birden fazla videoyu sorunsuz bir şekilde birleştirebilir. Statik görüntüler de oluşturabilir veya kendisine sağlanan kliplerden sonsuz döngüler üretebilir.

Video oyunlarının simülasyonlarını bile üretebilir Minecraft gibiyine Minecraft gibi bir oyunun nasıl görünmesi gerektiğini öğreten çok sayıda eğitim verisine dayanıyor. Sora’nın Minecraft tarzı bir ortamda bir oyuncuyu kontrol ederken aynı zamanda çevredeki ayrıntıları doğru bir şekilde işleyebildiği bir demoyu zaten görmüştük.

OpenAI şu anda Sora’nın bazı sınırlamalarını kabul ediyor. İnsanların ortadan kaybolması, dönüşmesi veya başka nesnelere karışması nedeniyle fizik her zaman anlamlı olmuyor. Sora, tek tek aktörler ve dekorlarla bir sahnenin haritasını çıkarmıyor; piksellerin kareden kareye nereye gitmesi gerektiğine dair inanılmaz sayıda hesaplama yapıyor.

Sora videolarında insanlar fizik kanunlarına aykırı hareket edebilir veya kurabiyeden alınan bir lokma gibi ayrıntılar bir kareden diğerine hatırlanamayabilir. OpenAI bu sorunların farkındadır ve bunları düzeltmek için çalışmaktadır; aşağıdaki örneklerden bazılarına göz atabilirsiniz: OpenAI Sora web sitesi ne demek istediğimizi görmek için.

Bu hatalara rağmen OpenAI, Sora’nın gelecekte fiziksel ve dijital dünyaların gerçekçi bir simülatörü haline gelebileceğini umuyor. Gelecek yıllarda Sora teknolojisi, keşfetmemiz için hayali sanal dünyalar oluşturmak veya yapay zekada kopyalanan gerçek yerleri tam olarak keşfetmemizi sağlamak için kullanılabilir.

OpenAI Sora’yı nasıl kullanabilirsiniz?

Şu anda Sora’ya davet olmadan giremezsiniz: Görünüşe göre OpenAI, video tarafından oluşturulan AI modelinin tam kamuya açık sürüme hazır hale getirilmesine yardımcı olmak için bireysel yaratıcıları ve test uzmanlarını seçiyor. Bu önizleme döneminin ne kadar süreceği (aylar mı yoksa yıllar mı) henüz bilinmiyor; ancak OpenAI daha önce yapay zeka projeleri söz konusu olduğunda mümkün olduğu kadar hızlı hareket etme isteğini göstermişti.

OpenAI’nin halka açıkladığı mevcut teknolojilere (Dall-E ve ChatGPT) dayanarak Sora’nın başlangıçta bir web uygulaması olarak sunulması muhtemel görünüyor. ChatGPT piyasaya sürülmesinden bu yana daha akıllı hale geldi ve özel botlar da dahil olmak üzere yeni özellikler ekledi ve Sora’nın da tam olarak piyasaya sürüldüğünde aynı yolu izlemesi muhtemel.

OpenAI, bu gerçekleşmeden önce bazı güvenlik bariyerleri koymak istediğini söylüyor: aşırı şiddet, cinsel içerik, nefret dolu görüntüler veya ünlülerin benzerlerini gösteren videolar oluşturamayacaksınız. Sora videolarına yapay zeka tarafından oluşturulduğunu gösteren meta veriler ekleyerek yanlış bilgilerle mücadele etme planları da var.

Bunları da beğenebilirsin





genel-6