Geçen hafta, Nvidia yeni bir sürümünü piyasaya sürdü. Nvidia Yayını (yeni sekmede açılır) — gürültü bastırma, arka plan kaldırma/değiştirme, kamera çerçeveleme ve şimdi… Göz Teması yapabilen derin öğrenme ve yapay zeka destekli yazılım. Sonuncusu şu anda betada ve… muhtemelen betada kalmalı.
AI ve derin öğrenme, son zamanlarda iyi bir nedenle haberlerde çok yer aldı. Dall-E, Midjourney ve Stable Diffusion gibi şeyler, genellikle oldukça çarpıcı sonuçlarla metinden sanat yaratıyor. Elbette, diğer zamanlarda iki buçuk başlı ve çok fazla uzuvlu ezilmiş mutant yaratıklarla karşılaşıyorsunuz. Metin tarafında, ChatGPT birçok korkunun İngilizce denemeler ve gazetecilik için ölüm çanı anlamına geldiğine dair okunaklı yazılar çalkalıyor (ve hayır, bu haber gönderisini yazmadı).
Göz Teması’nın arkasındaki fikir yeterince basit: Bir web yayınında veya toplantıdayken, genellikle kameradan başka yöne bakarsınız. Aslında, gerçek bir şansın var her zaman kameradan uzaklaşmak — çünkü kamera ekranın üst kısmındadır ve bakmak istediğiniz şeyler ekrandadır. Peki ya kameranıza bakmadan kameranıza bakıyormuş gibi görünmenin bir yolu olsaydı?
Ya yüzler üzerinde bir AI modeli eğitebilseydiniz ve ona birinin doğrudan merceğe bakmadığı görüntüyü düzeltmeyi öğretebilseydiniz? Uygun şekilde etiketlenmiş milyonlarca görüntüyü alın, ağa besleyin ve harika bir araç ortaya çıkıyor, değil mi?
Bunu uygulamak o kadar basit değil; Nvidia, bir yılı aşkın bir süredir Göz Teması özelliğinden bahsediyor ve bu özellik daha yeni halka açık (beta) sürümüne giriyor. Dünyanın dört bir yanındaki sayısız yüz arasındaki farklar, onu “çözülmesi” zor bir sorun haline getiriyor ve şimdi bile sonuçlar… kusurlu (ve bu durumu güzel bir şekilde ifade ediyor).
Devam ettim ve yine de RTX 3090 Ti içeren bir sistemde test ettim:
Test sırasında fark ettiğim şeylerden biri, odak noktam aynı yerde kalsa da, canlı video akışının kameraya bakmamla başka yere bakmam arasında gidip gelmesiydi. Sanırım bu kasıtlı olabilir, çünkü tüm görüntülü sohbet boyunca birinin doğrudan kameraya bakması biraz ürkütücü olabilir – ama öyleyse, zamanlamada bazı ayarlamalar yapılması gerekiyor.
Söylemesi daha zor olan şey, bu tür bir etkinin ilk etapta faydalı olup olmadığıdır. Kameraya bakıyormuş gibi görünmek istiyorsan, muhtemelen kameraya bakmayı öğrenmelisin. Yapay zeka aracılığıyla insan hatasını çözmek, kötü alışkanlıkları teşvik etmekle sonuçlanabilir – göz temasını düzeltmeyen bir video akışına girerseniz ne olur?
Ne olursa olsun, Göz Teması ile Nvidia Broadcast artık RTX sahiplerinin test etmesi için hazır. Bir RTX 3090 Ti ile test ettim, ancak Nvidia giriş noktası olarak RTX 2060’ı listeliyor (ve bildiğim kadarıyla bu, mobil RTX 3050 GPU’ları da içermelidir). Uzun vadede, bir noktada Nvidia’nın bir RTX 2060’tan daha karmaşık ve daha hızlı donanım gerektiren bazı AI modelleriyle sonuçlanacağından şüpheleniyorum – tıpkı DLSS 3’ün Çerçeve Oluşturma özelliğinin bir RTX 40 serisi grafik kartı gerektirdiği gibi – ama şimdilik Son dört yılda üretilen herhangi bir RTX GPU bu özelliği çalıştırabilir.
Efekti seviyor musun, nefret mi ediyorsun, ürkütücü mü buluyorsun yoksa başka bir şey mi? Görmeyi tercih ettiğiniz diğer efektlerle birlikte yorumlarda bize bildirin. Ben şahsen Toy Jensen gibi sanal çizgi film avatarlarının gerçek insanların yerine konuşabileceği, belki de AI tarafından yazılan makaleleri okuyacağı, videoların ve makalelerin her ikisinin de AI tarafından tüketileceği zamanı dört gözle bekliyorum.
Oradan aşağısı robotlar!