Yapay zeka tarafından oluşturulan yüksek kaliteli videolara yönelik yarış kızışıyor.

Pazartesi günü, film ve görüntü içeriği yaratıcılarına yönelik üretken yapay zeka araçları geliştiren bir şirket olan Runway, Gen-3 Alpha’yı tanıttı. Şirketin en yeni yapay zeka modeli, metin açıklamalarından ve hareketsiz görüntülerden video klipler oluşturuyor. Runway, modelin, Runway’in önceki amiral gemisi video modeli Gen-2’ye göre üretim hızında ve kalitesinde “büyük” bir gelişme sağladığını ve ayrıca oluşturduğu videoların yapısı, stili ve hareketi üzerinde ayrıntılı kontroller sağladığını söylüyor.

Gen-3 önümüzdeki günlerde Runway’in yaratıcı iş ortakları programındaki kurumsal müşteriler ve yaratıcılar da dahil olmak üzere Runway abonelerine sunulacak.

Runway şöyle yazdı: “3. Nesil Alpha, geniş bir yelpazedeki eylemler, jestler ve duygularla etkileyici insan karakterleri oluşturmada başarılı.” bir gönderide kendi blogunda. “Çok çeşitli stilleri ve sinema terminolojisini yorumlamak için tasarlandı [and enable] yaratıcı geçişler ve sahnedeki öğelerin hassas ana çerçevelemesi.”

Gen-3 Alpha’nın, görüntülerinin maksimum 10 saniyede dolması da dahil olmak üzere sınırlamaları var. Bununla birlikte, Runway kurucu ortağı Anastasis Germanidis, Gen-3’ün, yükseltilmiş altyapı üzerine eğitilmiş yeni nesil model ailesinde yer alan çeşitli video oluşturma modellerinden yalnızca ilki ve en küçüğü olduğunu vaat ediyor.

Germanidis bu sabah TechCrunch’a verdiği bir röportajda “Model karmaşık karakter ve nesne etkileşimleriyle mücadele edebilir ve nesiller her zaman fizik kanunlarını tam olarak takip etmez” dedi. “Bu ilk dağıtım, Gen-2’ye göre gözle görülür derecede daha hızlı üretim süreleriyle 5 ve 10 saniyelik yüksek çözünürlüklü nesilleri destekleyecek. 5 saniyelik bir klibin oluşturulması 45 saniye sürüyor, 10 saniyelik bir klibin oluşturulması ise 90 saniye sürüyor.”

Tüm video oluşturma modelleri gibi Gen-3 Alpha da çok sayıda video ve görüntü örneği üzerinde eğitildi, böylece yeni klipler oluşturmak için bu örneklerdeki kalıpları “öğrenebildi”. Eğitim verileri nereden geldi? Pist bunu söylemez. Bugünlerde az sayıda üretken yapay zeka sağlayıcısı bu tür bilgileri gönüllü olarak veriyor, bunun nedeni kısmen eğitim verilerini rekabet avantajı olarak görmeleri ve dolayısıyla bu verileri ve onunla ilgili bilgileri gizli tutmaları.

Germanidis, “Tüm eğitimlerimizi denetleyen kurum içi bir araştırma ekibimiz var ve modellerimizi eğitmek için seçilmiş, dahili veri kümelerini kullanıyoruz” dedi. Bunu orada bıraktı.

Pist Gen-3
Runway’in Gen-3 modelinden bir örnek. Bulanıklığın ve düşük çözünürlüğün Gen-3’ten değil, TechCrunch’ın kullandığı videodan GIF’e dönüştürme aracından kaynaklandığını unutmayın.
Resim Kredisi: Koşu yolu

Satıcının web’deki telif hakkıyla korunan veriler de dahil olmak üzere kamuya açık veriler üzerinde eğitim alması durumunda, eğitim verileri ayrıntıları aynı zamanda fikri mülkiyetle ilgili davaların potansiyel bir kaynağıdır ve bu da daha fazlasının ifşa edilmesine yönelik başka bir caydırıcıdır. Birçok vakalar mahkemelerden geçerek satıcıları reddediyorlar adil kullanım eğitimi veri savunmalarıüretken yapay zeka araçlarının, sanatçıların tarzlarını sanatçıların izni olmadan kopyaladığını ve kullanıcıların, sanatçıların hiçbir ödeme alamadığı, sanatçıların orijinallerine benzeyen yeni çalışmalar üretmesine izin verdiğini savunuyor.

Runway, modelin geliştirilmesinde sanatçılara danışıldığını söyleyerek telif hakkı konusuna biraz değindi. (Hangi sanatçılar? Net değil.) Bu, Germanidis’in 2023’te TechCrunch’ın Disrupt konferansında şömine başında bana söylediklerini yansıtıyor:

“Bunu ele almak için en iyi yaklaşımların neler olduğunu bulmak için sanatçılarla yakın işbirliği içinde çalışıyoruz” dedi. “Daha da büyüyebilmek ve yeni nesil modeller oluşturabilmek için çeşitli veri ortaklıklarını araştırıyoruz.”

Runway ayrıca, Runway’in hizmet şartlarına uymayan, telif hakkıyla korunan görsellerden ve içerikten video oluşturma girişimlerini engelleyen bir denetleme sistemi de dahil olmak üzere, Gen-3’ü yeni bir dizi güvenlik önlemiyle piyasaya sürmeyi planladığını söylüyor. Ayrıca, videoların Gen-3’ten geldiğini belirlemek için Microsoft, Adobe, OpenAI ve diğerleri tarafından desteklenen C2PA standardıyla uyumlu bir kaynak sistemi de üzerinde çalışılıyor.

Germanidis, “Yeni ve geliştirilmiş şirket içi görsel ve metin denetleme sistemimiz, uygunsuz veya zararlı içeriği filtrelemek için otomatik gözetim kullanıyor” dedi. “C2PA kimlik doğrulaması, tüm Gen-3 modelleriyle oluşturulan medyanın kaynağını ve orijinalliğini doğruluyor. Model yetenekleri ve yüksek kaliteli içerik üretme yeteneği arttıkça, hizalama ve güvenlik çabalarımıza önemli ölçüde yatırım yapmaya devam edeceğiz.”

Pist Gen-3
Resim Kredisi: Koşu yolu

Runway ayrıca, “belirli sanatsal ve anlatısal gereksinimleri” hedef alarak daha “üslup açısından kontrollü” ve tutarlı karakterlere izin veren 3. Nesil’in özel versiyonlarını oluşturmak için “önde gelen eğlence ve medya kuruluşlarıyla” ortaklık kurduğunu ve işbirliği yaptığını da açıkladı. Şirket şunları ekliyor: “Bu, oluşturulan karakterlerin, arka planların ve öğelerin çeşitli sahnelerde tutarlı bir görünüm ve davranışı koruyabileceği anlamına geliyor.”

Video oluşturma modelleriyle ilgili çözülmemiş büyük bir sorun, kontroldür; yani, yaratıcının sanatsal niyetleriyle uyumlu, tutarlı video oluşturacak bir model elde etmektir. Meslektaşım Devin Coldewey’in geçenlerde yazdığı gibi, geleneksel film yapımında bir karakterin kıyafetinde renk seçmek gibi basit meseleler, her çekim diğerlerinden bağımsız olarak yaratıldığı için üretken modellerle geçici çözümler gerektirir. Bazen geçici çözümler bile işe yaramaz; editörlere kapsamlı manuel iş kalır.

Runway, Google (bulut bilgi işlem kredisine sahip olduğu) ve Nvidia’nın yanı sıra Amplify Partners, Felicis ve Coatue gibi risk sermayedarları da dahil olmak üzere yatırımcılardan 236,5 milyon dolardan fazla para topladı. Şirket, üretken yapay zeka teknolojisine yaptığı yatırımlar arttıkça kendisini yaratıcı sektörle yakın bir şekilde uyumlu hale getiriyor. Runway, kurumsal müşteriler için prodüksiyon ortağı olarak hizmet veren bir eğlence bölümü olan Runway Studios’u işletiyor ve tamamen veya kısmen yapay zeka tarafından üretilen filmlerin sergilenmesine adanmış ilk etkinliklerden biri olan Yapay Zeka Film Festivali’ne ev sahipliği yapıyor.

Ama rekabet giderek kızışıyor.

Pist Gen-3
Resim Kredisi: Koşu yolu

Üretken yapay zeka girişimi Luma geçen hafta duyuruldu Dream Machine, memleri canlandırma konusundaki yeteneğiyle viral hale gelen bir video oluşturucu. Ve sadece birkaç ay önce Adobe, Adobe Stock medya kütüphanesindeki içerik üzerine eğitilmiş kendi video oluşturma modelini geliştirdiğini açıkladı.

Başka yerlerde, OpenAI’nin Sora gibi sıkı güvenlik önlemlerini koruyan ancak OpenAI’nin pazarlama ajansları, bağımsız ve Hollywood film yönetmenleriyle tohumladığı yerleşik şirketler var. (OpenAI CTO’su Mira Murati, 2024 Cannes Film Festivali’ne katıldı.) AI araçları kullanılarak yapılan filmlerin küratörlüğünü yapmak için Runway ile de ortaklığı bulunan bu yılki Tribeca Festivali’nde, erken erişim hakkı verilen yönetmenler tarafından Sora ile üretilen kısa filmler yer aldı.

Google ayrıca, Veo’yu YouTube Shorts gibi ürünlere taşımak için çalışan görsel oluşturma modeli Veo’yu aralarında Donald Glover (diğer adıyla Childish Gambino) ve yaratıcı ajansı Gilga’nın da bulunduğu seçkin içerik oluşturucuların kullanımına sundu.

Ancak çeşitli işbirlikleri sarsılsa da bir şey netleşiyor: Üretken yapay zeka video araçları, bildiğimiz film ve TV endüstrisini altüst etme tehdidinde bulunuyor.

Pist Gen-3
Resim Kredisi: Koşu yolu

Film yapımcısı Tyler Perry yakın zamanda söylendi Sora’nın neler yapabileceğini gördükten sonra yapım stüdyosunda planlanan 800 milyon dolarlık genişlemeyi askıya aldığını söyledi. Joe Russo, “Avengers: Endgame” gibi destek amaçlı Marvel filmlerinin yönetmeni tahmin Yapay zekanın bir yıl içinde tam teşekküllü bir film yaratabileceği.

2024 çalışmak Hollywood animatörlerini ve karikatüristlerini temsil eden bir sendika olan Animation Guild tarafından görevlendirilen bir araştırma, yapay zekayı benimseyen film yapım şirketlerinin yüzde 75’inin, teknolojiyi bünyesine kattıktan sonra işleri azalttığını, birleştirdiğini veya ortadan kaldırdığını ortaya çıkardı. Çalışma aynı zamanda 2026 yılına kadar ABD’de 100.000’den fazla eğlence işinin üretken yapay zeka nedeniyle sekteye uğrayacağını tahmin ediyor.

Video oluşturma araçlarının diğer üretken yapay zeka teknolojilerinin izinden gitmemesini ve dik düşüşler yaratıcı çalışmalara olan talep.



genel-24