OpenAI, Bir Dakikalık Klipler Oluşturabilen Yapay Zeka Destekli Metin-Video Oluşturucusu Sora'yı Tanıttı - Dünyadan Güncel Teknoloji Haberleri

ChatGPT’nin arkasındaki şirket olan OpenAI, perşembe günü ilk yapay zeka (AI) destekli metinden videoya dönüştürme modeli Sora’yı tanıttı. Şirket, 60 saniyeye kadar uzunlukta videolar oluşturabileceğini iddia ediyor. Bu, geçen ay tanıtılan Google’ın Lumiere modeli de dahil olmak üzere segmentteki rakiplerinden daha uzun. Sora şu anda kırmızı ekip üyelerine, şirketlerin yazılımlarını geliştirmelerine yardımcı olmak için yazılımları kapsamlı bir şekilde test eden siber güvenlik uzmanlarına ve bazı içerik oluşturuculara açıktır. AI firması ayrıca, model bir OpenAI ürününde konuşlandırıldıktan sonra gelecekte Coalition for Content Provenance and Authenticity (C2PA) meta verilerini de dahil etmeyi planlıyor.

AI video oluşturucunun duyurusu postalamak Şirket, X’te (eski adıyla Twitter olarak biliniyordu) şunları söyledi: “Sora, son derece ayrıntılı sahneler, karmaşık kamera hareketleri ve canlı duygulara sahip birden fazla karakter içeren 60 saniyeye kadar videolar oluşturabilir.” İlginç bir şekilde, oluşturduğunu iddia ettiği videonun uzunluğu rakiplerinin sunduğundan on kat daha fazla. Google’ın Lumiere’si 5 saniye uzunluğunda videolar oluşturabilirken Runway AI ve Pika 1.0 sırasıyla 4 saniye ve 3 saniye uzunluğunda videolar oluşturabiliyor.

Komut istemi: “Kırmızı yünlü örme motosiklet kaskı takan 30 yaşındaki uzay adamının maceralarını, mavi gökyüzünü, tuzlu çölü, sinema tarzını, 35mm filme çekilmiş, canlı renkleri içeren bir film fragmanı.” pic.twitter.com/0JzpwPUGPB

— OpenAI (@OpenAI) 15 Şubat 2024

OpenAI ve CEO Sam Altman’ın X hesabı da Sora tarafından oluşturulan birden fazla videoyu ve bunları oluşturmak için kullanılan komutları paylaştı. Ortaya çıkan videolar kesintisiz hareketlerle son derece ayrıntılı görünüyor; bu, piyasadaki diğer video oluşturucuların bir şekilde uğraştığı bir şey. Şirkete göre birden fazla karakter, birden fazla kamera açısı, belirli hareket türleri ve konu ve arka planın doğru ayrıntılarıyla karmaşık sahneler oluşturulabiliyor. Bu mümkündür çünkü metinden videoya modeli hem bilgi istemini hem de “bu şeylerin fiziksel dünyada nasıl var olduğunu” kullanır.

Sora, esasen GPT modellerine benzer bir transformatör mimarisi kullanan bir difüzyon modelidir. Benzer şekilde, tükettiği ve ürettiği veriler, yine metin oluşturma modellerindeki belirteçlere benzeyen yamalar adı verilen bir terimle temsil edilir. Yamalar, şirkete göre küçük parçalar halinde paketlenmiş video ve görsel koleksiyonlarıdır. Bu görsel verileri kullanmak, OpenAI’nin video oluşturma modelini farklı süreler, çözünürlükler ve en boy oranlarında eğitmesine olanak sağladı. Sora, metinden videoya dönüştürmenin yanı sıra hareketsiz bir görüntü alıp ondan bir video da oluşturabilir.

Ancak kusurları da yok değil. OpenAI kendi açıklamasında belirtti İnternet sitesi, “Mevcut modelin zayıf yönleri var. Karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmekte zorlanabilir ve belirli neden-sonuç örneklerini anlayamayabilir. Örneğin bir kişi kurabiyeden bir ısırık alabilir ama daha sonra kurabiyede ısırık izi kalmayabilir.”

Komut: “Animasyon sahnesinde, eriyen kırmızı bir mumun yanında diz çökmüş kısa tüylü bir canavarın yakın çekimi yer alıyor. Sanat stili 3 boyutlu ve gerçekçi olup, aydınlatma ve dokuya odaklanılmıştır. Canavar aleve bakarken, resmin havası merak ve merak dolu… pic.twitter.com/aLMgJPI0y6

— OpenAI (@OpenAI) 15 Şubat 2024

Yapay zeka aracının deepfake veya diğer zararlı içerik oluşturmak için kullanılmamasını sağlamak amacıyla şirket, yanıltıcı içeriği tespit etmeye yardımcı olacak araçlar geliştiriyor. Ayrıca yakın zamanda DALL-E 3 modeli için uygulamayı benimsedikten sonra, oluşturulan videolarda C2PA meta verilerini kullanmayı planlıyor. Ayrıca modeli geliştirmek için kırmızı ekip üyeleriyle, özellikle de yanlış bilgi, nefret dolu içerik ve önyargı alanlarındaki alan uzmanlarıyla birlikte çalışıyor.

Şu anda ürün hakkında geri bildirim almak yalnızca kırmızı takım üyelerine ve az sayıda görsel sanatçıya, tasarımcıya ve film yapımcısına açıktır.

Bağlı kuruluş bağlantıları otomatik olarak oluşturulabilir; ayrıntılar için etik bildirimimize bakın.

genel-8

OpenAI, Bir Dakikalık Klipler Oluşturabilen Yapay Zeka Destekli Metin-Video Oluşturucusu Sora’yı Tanıttı

Byteknomers

By teknomers

Benzer İçerikler

Bu daha ucuz Apple Pencil alternatifi artık eğim algılama özelliğine ve daha iyi bir uç özelliğine sahip

WWE Raw, 2025’te Netflix’te Canlı Yayın Yapacak: Bilmeniz Gerekenler

AB, şikayetin geri çekilmesinin ardından Apple’ın e-kitap ve sesli kitap kurallarına yönelik antitröst soruşturmasını kapattı

Nvidia RTX 50 grafik kartları 2025’te piyasaya sürüldüğünde yetersiz kalabilir

Black Friday’de Arkham Üçlemesi Batman Oyunlarını %50 İndirimle Switch’te Alın

Minecraft, Batman ve GoT modelleri de dahil olmak üzere Secretlab sandalyelerinde 100 $’a kadar tasarruf edin

PS5 Slim Fortnite Tatil Paketleri Kara Cuma Fiyatlarıyla Başlıyor

En iyi Black Friday tablet fırsatları: Pixel Tablet, iPad Air (M2, 2024), Galaxy Tab S9 ve daha fazlasında büyük tasarruf sağlayın

Bu inanılmaz Samsung Galaxy Watch Ultra Kara Cuma fırsatıyla 250 dolardan fazla tasarruf edin!

Best Buy, Kara Cuma için muhteşem Pixel 8a’da 200 $’a varan indirim sağlıyor

2024’ün en iyi hoparlörlerine sahip telefonlar

Hubble, genç yıldız FU Orionis hakkında heyecan verici ayrıntılar buluyor

Güneşimiz yeni bir simülasyonun yıldızı

Yaşamın kökeni araştırması, RNA’nın hem sol hem de sağ elini kullanan proteinleri destekleyebileceğini ortaya koyuyor

Gökbilimciler galaksimizin dışındaki bir yıldızın ilk yakın çekim fotoğrafını çekti

İlginizi Çekebilir

Destiny 2 Osiris Haritası Denemeleri ve 22 Kasım Ödülleri

Bu daha ucuz Apple Pencil alternatifi artık eğim algılama özelliğine ve daha iyi bir uç özelliğine sahip

Black Ops 6 Lansmanından Sonra ABD Oyun Tüketicisi Harcamaları %10 Arttı

WWE Raw, 2025’te Netflix’te Canlı Yayın Yapacak: Bilmeniz Gerekenler