Microsoft’taki araştırmacılar bu hafta hakkında bir makale yayınladılar. VASA-1, yalnızca hareketsiz bir görüntü kullanarak konuşan birinin ikna edici bir videosunu oluşturabilen yeni bir yapay zeka aracı. Microsoft’un yeni aracı halka sunma konusunda acil bir planı yok ancak oldukça etkileyici. Dişlere çok yakından bakmazsanız etkileyicidir. Şu chomper’lara bir bakın.

VASA-1 modeli, bir insan yüzünün herhangi bir sabit fotoğrafını çekerek çalışır (veya örneklerde olduğu gibi) Microsoft tarafından yayınlandıAslında var olmayan birinin yapay zeka tarafından oluşturulan yüzü ve bir ses dosyası beslendikten sonra yüz nüansları ve doğal görünümlü hareketler içeren senkronize bir video üretebiliyor.

Microsoft’un aşağıda sunduğu videolardan birinde görebileceğiniz gibi yine oldukça etkileyici. Ancak VASA-1’in zorlandığı alanlardan biri de dişlerin işlenmesidir. Dişlere odaklanırsanız, karikatürize bir kalite elde edebilirler, diğer her şeyin hiper gerçekçi kalitesine pek uymayan bir şekilde biraz hareketli görünebilirler.

Microsoft’tan VASA-1 Videosu

Gizmodo’nun aşağıdaki GIF’te yaptığı gibi, her şeyi yavaşlattığınızda videonun tuhaf dişleri daha da belirginleşiyor. (Aşağıdaki kişinin tam anlamıyla var olmadığını hatırlayana kadar birinin görünüşünü parçalara ayırmak neredeyse kendinizi kötü hissetmenize neden olabilir.)

Microsoft tarafından sağlanan ve aşağıda görünen başka bir örnek video, diğer özellikler çok gerçekçi görünmesine rağmen, özellikle de tek kaynak materyalin statik bir görüntü ve bir ses dosyası olduğunu hatırladığınızda, dişlerdeki benzer çizgi film benzeri nitelikleri göstermektedir.

Sebep ne olursa olsun, erkekleri gösteren videolardaki dişler biraz daha az fark ediliyordu; bunun nedeni belki de modelin, erkeklerin konuşurken ağızlarını o kadar geniş açtığını göstermemesiydi. Ancak yakından bakan herkes burada bir şeylerin yolunda gitmediğini hissedebilir.

VASA-1 Gösterimi (Erkek)

Araştırmacıların belirttiği en ilginç şeylerden biri, modelinin nispeten yüksek kaliteli videoyu çok hızlı bir şekilde üretebilmesidir; bu, diğer yapay zeka oluşturucularının da hoşuna giden bir şeydir. OpenAI’den Sora ile mücadele ettiği bildirildi. Aslında makale, tek bir NVIDIA işlemciye sahip bir masaüstü bilgisayarda yalnızca 0,17 saniyelik bir gecikme süresine dikkat çekiyor RTX 4090 GPU.

Ve bu hız, gerçek zamanlı çeviri hizmetleri gibi çeşitli uygulamalar için anında video sunabilen bir şeydir.

“Metodumuz yalnızca gerçekçi yüz ve kafa dinamikleriyle yüksek video kalitesi sunmakla kalmıyor, aynı zamanda ihmal edilebilir başlangıç ​​gecikmesiyle 40 FPS’ye kadar 512×512 videoların çevrimiçi oluşturulmasını da destekliyor. Yeni makale, insanın konuşma davranışlarını taklit eden gerçekçi avatarlarla gerçek zamanlı etkileşimlerin önünü açıyor” diyor.

VASA-1’in gerçek zamanlı verimlilik videosu

Araştırmacılar bu tür teknolojilerdeki tehlikelerin açıkça farkındalar; bu belki de Microsoft’un bunu neden henüz kamuoyuna duyurma planlarını açıklamadığını açıklıyor. Ancak araştırmacılar, insanlığa yararlı olacağına inandıkları kullanım örneklerini de belirlediler.

“Eğitimde eşitliğin artırılması, iletişim sorunu yaşayan bireyler için erişilebilirliğin artırılması, ihtiyacı olanlara arkadaşlık veya terapötik destek sunulması ve diğer birçok fayda gibi faydalar, araştırmamızın ve diğer ilgili keşiflerin öneminin altını çiziyor. Makalede, insanlığın refahını artırma hedefiyle yapay zekayı sorumlu bir şekilde geliştirmeye adadık” ifadeleri yer alıyor.

“Böyle bir bağlam göz önüne alındığında, teknolojinin sorumlu bir şekilde ve uygun düzenlemelere uygun olarak kullanılacağından emin olana kadar çevrimiçi bir demo, API, ürün, ek uygulama ayrıntıları veya ilgili herhangi bir teklif yayınlama planımız yok.”

Bu muhtemelen iyi bir fikir, göz önüne alındığında dolandırıcılık sayısı bu tür bir teknolojiyle mümkün. Sonuçta ABD’de 2024 başkanlık seçimlerine sadece yedi ay kaldı. Ve Küresel faşizm tehdidi yakın zamanda ortadan kaybolmayacak. İnsanlık şu anda yapay zeka tarafından üretilen sahtekarlıklara karşı gerçekten güçsüz olduğunu düşünüyor. Ve Microsoft gibi büyük şirketlerin, internetteki hemen hemen her şey sahte hale gelmeden önce potansiyel zararı sınırlamak için muhtemelen ellerinden gelen her şeyi yapmaları gerekiyor.



genel-7