Birkaç cümle yazıyorsunuz ve yapay zeka bunları profesyonel kullanım için bir video oluşturmak için kullanıyor. Bu, Meta’nın büyük dil modelleri olarak adlandırılan yeni “üretken” AI modelleri alanındaki mücadeleyi yeniden başlatan yeni hareketidir. Kullanıcı girişine göre kelimeler, resimler ve hatta videolar oluşturabilir. En ünlü hizmetin Open AI, Dall-E2 olduğu, ancak yakında kalabalıklaşan ve yeni ufuklara doğru ilerleyen bir alan. Meta’nın duyurusunun gösterdiği gibi.
Hizmetine Make-A-Video denir. Meta AI’nın üretken teknolojideki son gelişmeleri üzerine kuruludur ve yaratıcılara ve sanatçılara yöneliktir. Sistem, görüntülerle ilişkili metin verilerinden dünyanın nasıl yapıldığını öğrenebilir ve herhangi bir ilişkili metin olmadan filmlerden dünyanın nasıl hareket ettiğini anlayabilir. Meta, duyuruda, “Herkesin erişebileceği bir bilime olan bağlılığımızın bir parçası olarak, ayrıntıları bir makalede paylaşıyoruz ve bir gösteri deneyimi gerçekleştirmeyi planlıyoruz” diye yazıyor.
Yılın başında Meta, kelimeleri, metin satırlarını ve serbest el çizimlerini kullanarak fotogerçekçi ve sanatsal çizimler oluşturmak için her zaman aynı üretken AI modellerine dayanan Make-A Scene’i sundu.
Dall-E, şimdi sürüm 2’de, metinden görüntüler oluşturur ve beta sürümünde mevcuttur. Meta ürünlerinden farklı olarak zaten ticaridir. Bu şekilde birkaç yüz görüntü oluşturabileceğiniz krediler için ayda 15 dolarlık bir abonelik ödersiniz. Şu anda bir bekleme listesinden sonra giriş yapıyorsunuz.
Open AI şimdi Microsoft’un desteğinden yararlanırken, Google birkaç ay önce Imagen’i sundu, ancak bununla ne yapmak istediğine dair çok fazla ayrıntı vermedi.
Ayrıca metni gerçekçi bir fotoğrafa dönüştürmenizi sağlayan Crayion ve GuaGan olmak üzere iki farklı ürünü olan Nvidia da var.
Ve Ağustos ayında bir Açık Kaynak hizmeti, Stabil Difüzyonlar doğdu.
Bu hizmetlerin temelinde, aslında, genellikle “metin güdümlü üretici hasım ağları” için GAN olarak adlandırılan, çekişmeli üretici ağlar vardır. GAN’lar iki rakip sinir ağından oluşur: amacı mümkün olduğunca gerçekçi görüntüler oluşturmak olan bir oluşturucu ve oluşturucu tarafından oluşturulan görüntülerin yanlış olup olmadığını tanıma görevi olan bir ayrımcı. Bu yöntem derin sahte üretmek için kullanılır.
Modeller ve ilgili firmalar bu ürünlerin kalitesini ve güvenilirliğini artırmak için rekabet etmektedir. Örneğin, Dall-E’nin yeni versiyonu, belirli bir görüntüdeki çeşitli nesneler arasındaki ilişkiyi anlamada güçlü anlamsal tutarlılığı koruyabilir. Örneğin, “at üzerinde oturan bir kişi”, jokey kafasında değil eyerde otururken bir görüntü üretir. Modeller ayrıca doğru altyazılara sahip geniş bir resim veritabanı sayesinde ilerler.
Bu çabaların ardındaki fikir, reklam ve pazarlama gibi metin, resim, video üretimi ile ilişkili ticaret ve pazarları büyük ölçüde değiştirebilecek ürünler yaratmaktır.
Ancak firmaların yaklaşımları farklıdır.
Meta şu anda teknolojinin faydalarını daha fazla insanla paylaşmak için belirtildiği gibi açık bilim ilkelerini takip ediyor.
Tüm aktörler aynı zamanda ilgili zorlukların da farkındadır. Tehlikeli veya yanlış bilgi veren materyallerin (deepfake in primis) üretimine izin vermemek gibi ve bu nedenle bu ürünlerin kullanımını değerlendirmek için algoritmalar ve moderatör kadrosu kullanıyorlar.
İş konusu daha da karmaşıktır, yani bu sistemlerin insan değerini yok etmeden mevcut mesleklerle nasıl bir arada var olabileceği. Son günlerde çeşitli grafik sanatçılarının Stabil Yayılımlarla oluşturulan eserlere karşı protestoları nedeniyle ortaya çıkan bir endişe. Bu arada, bu sosyal zorluklar vurgulanırken ve bunların nasıl çözüleceği henüz net değilken, teknoloji gelişmeye devam ediyor.



genel-18