«Yapay zeka sizin için bir video oluşturur», işte yeni Meta hizmeti

Birkaç cümle yazıyorsunuz ve yapay zeka bunları profesyonel kullanım için bir video oluşturmak için kullanıyor. Bu, Meta’nın büyük dil modelleri olarak adlandırılan yeni “üretken” AI modelleri alanındaki mücadeleyi yeniden başlatan yeni hareketidir. Kullanıcı girişine göre kelimeler, resimler ve hatta videolar oluşturabilir. En ünlü hizmetin Open AI, Dall-E2 olduğu, ancak yakında kalabalıklaşan ve yeni ufuklara doğru ilerleyen bir alan. Meta’nın duyurusunun gösterdiği gibi.
Hizmetine Make-A-Video denir. Meta AI’nın üretken teknolojideki son gelişmeleri üzerine kuruludur ve yaratıcılara ve sanatçılara yöneliktir. Sistem, görüntülerle ilişkili metin verilerinden dünyanın nasıl yapıldığını öğrenebilir ve herhangi bir ilişkili metin olmadan filmlerden dünyanın nasıl hareket ettiğini anlayabilir. Meta, duyuruda, “Herkesin erişebileceği bir bilime olan bağlılığımızın bir parçası olarak, ayrıntıları bir makalede paylaşıyoruz ve bir gösteri deneyimi gerçekleştirmeyi planlıyoruz” diye yazıyor.
Yılın başında Meta, kelimeleri, metin satırlarını ve serbest el çizimlerini kullanarak fotogerçekçi ve sanatsal çizimler oluşturmak için her zaman aynı üretken AI modellerine dayanan Make-A Scene’i sundu.
Dall-E, şimdi sürüm 2’de, metinden görüntüler oluşturur ve beta sürümünde mevcuttur. Meta ürünlerinden farklı olarak zaten ticaridir. Bu şekilde birkaç yüz görüntü oluşturabileceğiniz krediler için ayda 15 dolarlık bir abonelik ödersiniz. Şu anda bir bekleme listesinden sonra giriş yapıyorsunuz.
Open AI şimdi Microsoft’un desteğinden yararlanırken, Google birkaç ay önce Imagen’i sundu, ancak bununla ne yapmak istediğine dair çok fazla ayrıntı vermedi.
Ayrıca metni gerçekçi bir fotoğrafa dönüştürmenizi sağlayan Crayion ve GuaGan olmak üzere iki farklı ürünü olan Nvidia da var.
Ve Ağustos ayında bir Açık Kaynak hizmeti, Stabil Difüzyonlar doğdu.
Bu hizmetlerin temelinde, aslında, genellikle “metin güdümlü üretici hasım ağları” için GAN olarak adlandırılan, çekişmeli üretici ağlar vardır. GAN’lar iki rakip sinir ağından oluşur: amacı mümkün olduğunca gerçekçi görüntüler oluşturmak olan bir oluşturucu ve oluşturucu tarafından oluşturulan görüntülerin yanlış olup olmadığını tanıma görevi olan bir ayrımcı. Bu yöntem derin sahte üretmek için kullanılır.
Modeller ve ilgili firmalar bu ürünlerin kalitesini ve güvenilirliğini artırmak için rekabet etmektedir. Örneğin, Dall-E’nin yeni versiyonu, belirli bir görüntüdeki çeşitli nesneler arasındaki ilişkiyi anlamada güçlü anlamsal tutarlılığı koruyabilir. Örneğin, “at üzerinde oturan bir kişi”, jokey kafasında değil eyerde otururken bir görüntü üretir. Modeller ayrıca doğru altyazılara sahip geniş bir resim veritabanı sayesinde ilerler.
Bu çabaların ardındaki fikir, reklam ve pazarlama gibi metin, resim, video üretimi ile ilişkili ticaret ve pazarları büyük ölçüde değiştirebilecek ürünler yaratmaktır.
Ancak firmaların yaklaşımları farklıdır.
Meta şu anda teknolojinin faydalarını daha fazla insanla paylaşmak için belirtildiği gibi açık bilim ilkelerini takip ediyor.
Tüm aktörler aynı zamanda ilgili zorlukların da farkındadır. Tehlikeli veya yanlış bilgi veren materyallerin (deepfake in primis) üretimine izin vermemek gibi ve bu nedenle bu ürünlerin kullanımını değerlendirmek için algoritmalar ve moderatör kadrosu kullanıyorlar.
İş konusu daha da karmaşıktır, yani bu sistemlerin insan değerini yok etmeden mevcut mesleklerle nasıl bir arada var olabileceği. Son günlerde çeşitli grafik sanatçılarının Stabil Yayılımlarla oluşturulan eserlere karşı protestoları nedeniyle ortaya çıkan bir endişe. Bu arada, bu sosyal zorluklar vurgulanırken ve bunların nasıl çözüleceği henüz net değilken, teknoloji gelişmeye devam ediyor.

genel-18

Byteknomers

By teknomers

Benzer İçerikler

Uzun zamandır beklenen 2. Dünya Savaşı RTS’nin yeniden canlandırılması nihayet lansman tarihini duyurdu

Marvel Rivals Kapalı Alfa Öncesinde Loki Fragmanını Gösteriyor

Bugün Quordle – 24 Nisan Çarşamba için ipuçları ve cevaplar (oyun #821)

Marvel Rivals Kapalı Alfa Öncesinde Loki Fragmanını Gösteriyor

Vampire Survivors, Steam korku aksiyon oyunuyla yeni bir rakip kazanıyor

Sea of Thieves Sezon 12 Gelecek Hafta Yeni Silahlar ve Evcil Hayvanlarla Başlıyor

Expeditions: A MudRunner Oyun Güncellemesi 1.05, 3. Yamayı 23 Nisan’da Yayınlıyor

Bu telefon üreticisinin güçlü Snapdragon 8 Gen 4 AP’yi ilk kullanan kişi olacağı tahmin ediliyor

Şirket, Mint’in T-Mobile tarafından satın alınmasının savunmasız tüketicilere nasıl zarar verebileceğini açıklıyor

Xfinity Mobile ve Comcast Business cihazları WiFi erişim noktası hız yükseltmesine sahip oluyor

CMF by Nothing yakında bize ilk uygun fiyatlı akıllı telefonunu sunabilir

Güneş Tutulması Sırasında “Lanetli” SOHO Kuyruklu Yıldızına Nadir Bir Bakış

TRAPPIST-1e’de hayat olup olmadığını bilecek miyiz?

Metan neden Mars’a sızıyor? NASA bilim adamlarının yeni fikirleri var

NASA’nın Voyager 1’i 5 Ay Sonra Veri Aktarımını Yeniden Sağlıyor

İlginizi Çekebilir

Uzun zamandır beklenen 2. Dünya Savaşı RTS’nin yeniden canlandırılması nihayet lansman tarihini duyurdu

Gişe: Lupita Nyong’o’nun Seslendirdiği ‘Vahşi Robot’ Eylül Ayındaki Gösterim Tarihinde Küçük Değişiklik Yapıyor

Framework artık sadece bir dizüstü bilgisayar şirketi olmayacak

Cybertruck kurşun geçirmezdir ancak lütfen çok dikkatli yıkayın