George Drettakis kendisiyle mutlu olabilir. Sophia Antipolis’teki (Alpes-Maritimes) Dijital Bilimler ve Teknolojiler Ulusal Araştırma Enstitüsü’nden (Inria) ekibi, GraphDeco ve Saarbrücken’deki (Almanya) Max Planck Bilgisayar Bilimleri Enstitüsü’nden bir meslektaşıyla birlikte, bir algoritma geliştirdiler. Google ve Nvidia gibi büyük şirketlerin rakiplerini, üstün oldukları bir alanda, yani bilgisayar görüşünde geride bırakıyor. Daha spesifik olarak, bu yeni program eski bir rüyayı gerçekleştiriyor: basit fotoğraflardan sahnelerin üç boyutlu olarak oluşturulması.

Yani bir nesnenin, bir binanın, bir kalabalığın birkaç çekimi, onları herhangi bir açıdan görmek, yakınlaştırmak, döndürmek için yeterli… Sinemadaki özel efekt profesyonelleri, video oyunlarındaki profesyoneller, mimarlar projelerini kendi projelerinde görselleştirmek için. çevre, evleri gösterecek emlakçılar, robot mühendisler (makineyi yönlendirmek için üç boyutlu “plan” yapmak daha iyidir)… böyle bir işleve bayılıyorlar.

2020 yılına kadar yöntemler bu görüntülemeyi mümkün kılıyordu ancak oldukça kesin olmayan sonuçlar (yansıma eksikliği, görünmez ayrıntılar, “delikler”…) için çok fazla hesaplama süresi gerektiriyordu. Başlangıç ​​olarak, iki farklı açıdan alınan ancak pikselleri ortak olan iki görüntüden bir derinlik haritası hesaplanır. Bu, uzayda seyrek bir nokta bulutu, sahnenin bir tür şeffaf hayaleti yaratır. Bu bulut daha sonra hayaleti ortaya çıkarmak için yoğunlaştırılır. Daha sonra, hesaplama açısından pahalı bir adım olan bu noktalardan, şekilleri oluşturmak için yüzeylerin, renklerin ve dokuların uygulandığı küçük üçgenlerden oluşan bir ağ çıkarılır.

Eğlenceli gösteriler

2020’de bir Google ekibi şu özelliklerle alanda devrim yaratıyor: NeRF yöntemiYapay sinir ağlarına dayalıdır. Çağdaş yapay zekanın kalbinde yer alan bu nesne, sahneyi oldukça soyut bir şekilde kodlamak için kullanılıyor. Bu kodlama, araştırmacıların algoritmalarını test etmeleri için referans görevi gören sahneler için kırk sekiz saatlik hesaplama süresi gerektirir, ancak görüntülerin doğruluğu çok daha iyidir.

2023 yazında Sofia Antipolis ekibi yöntemiyle darbe vuruyor “3D Gauss Splatting” veya 3DGS, “Üç boyutlu Gaussianların patlaması” için. Otuz dakika içinde, yüz fotoğraftan, saniyede yüz yüksek kaliteli görüntü hızında her açıdan görülebilen üç boyutlu bir model elde ediyor. Bu, NeRF’den yüz kat daha iyi performans gösteren Nvidia’nın Instant NGP’sinden yüz kat daha fazla. “Kendimi öne çıkarma alışkanlığım yok. Ancak yirmi yılı aşkın süredir bu soruna adanmış çalışmanın ardından neredeyse çözüldüğünü söyleyebileceğim bir durumla karşılaşacağımı düşünmemiştim”bu çalışma için kamu finansmanı (özellikle Inria ve Avrupa Araştırma Konseyi’nden gelen bağışlar) konusunda ısrar eden George Drettakis’in ifadesine göre.

Bu makalenin okunacak %43,64’ü kaldı. Geri kalanı abonelere ayrılmıştır.



genel-14