Yapay zeka araştırma laboratuvarı OpenAI, 3D işlemede büyük iyileştirmeler görecek olan en son teknolojisiyle ilgili ayrıntıları açıkladı.
OpenAI, şimdi dikkatini metin istemlerini POINT-E olarak adlandıracağı 3B nokta bulutlarına çevirmeye çeviren metinden görüntüye oluşturucu DALL-E’nin arkasındaki şirkettir.
göre bir kağıt (yeni sekmede açılır) OpenAI tarafından yayınlanan POINT-E, saatler sürebilen ve birden fazla GPU gerektirebilen diğer mevcut çözümlerle karşılaştırıldığında “tek bir GPU’da yalnızca 1-2 dakikada 3D modeller üretir”.
OpenAI POINT-E
Makaleden bir alıntı, POINT-E’nin 3B model oluşturma dünyasındaki mevcut yerini ayrıntılarıyla anlatıyor:
“Metodumuz, numune kalitesi açısından en son teknolojinin gerisinde kalsa da, numune almak bir ila iki kat daha hızlıdır ve bazı kullanım durumları için pratik bir değiş tokuş sunar.”
Metinden görüntüye difüzyon modeliyle tek bir sentetik görünüm oluşturarak çalışır. Ardından, sentezlenmesi daha kolay olan ve dolayısıyla GPU’lar üzerindeki yükü azaltan bir 3B nokta bulutu oluşturulur, ancak daha küçük ayrıntıları yakalayamadığı için makalede bahsedilen değiş tokuştur.
Bunun bir kısmını hafifletmek için ikincil bir yapay zeka eğitildi, ancak çalışma bunun “bazen nesnelerin ince/seyrek kısımlarını gözden kaçırabileceğini” açıklıyor, örneğin bir bitkinin sapları gibi, yüzen çiçek yanılsaması veriyor.
OpenAI, yapay zekayı birkaç milyon 3D model ve bunların meta verileri üzerinde eğitmeyi vaat ediyor, ancak kullanım durumları şimdilik oldukça sınırlı.
Bu tür bir örnek, 3D baskı için gerçek dünya nesnelerinin işlenmesini içerir, ancak teknoloji gelişip daha rafine hale geldikçe, onun oyun ve hatta televizyon gibi daha gelişmiş durumlarda kullanıldığını görmemiz muhtemeldir.
Projenin açık kaynak kodu şu adreste mevcuttur: GitHub (yeni sekmede açılır),