Yapay zeka dünyasını kasıp kavuracak bir sonraki atılım, 3B model üreteçleri olabilir. Bu hafta, bir metin istemi verilen bir 3B nesne oluşturan bir makine öğrenme sistemi olan OpenAI açık kaynaklı Point-E. göre bir kağıt yanında yayınlanan kod tabanıPoint-E, tek bir Nvidia V100 GPU’da 1 ila 2 dakikada 3D modeller üretebilir.

Point-E, geleneksel anlamda 3B nesneler oluşturmaz. Bunun yerine, uzayda bir 3B şekli temsil eden nokta bulutları veya ayrı veri noktaları kümeleri oluşturur – bu nedenle arsız kısaltmadır. (Point-E’deki “E”, “verimlilik”in kısaltmasıdır, çünkü görünürde önceki 3B nesne oluşturma yaklaşımlarından daha hızlıdır.) Nokta bulutlarının hesaplama açısından sentezlenmesi daha kolaydır, ancak bir nesnenin ince taneli ayrıntılarını yakalamazlar. şekil veya doku – şu anda Point-E’nin önemli bir sınırlaması.

Bu sınırlamayı aşmak için Point-E ekibi, Point-E’nin nokta bulutlarını ağlara dönüştürmek için ek bir yapay zeka sistemi eğitti. (Bir nesneyi tanımlayan köşelerin, kenarların ve yüzlerin koleksiyonları olan ağlar, 3B modelleme ve tasarımda yaygın olarak kullanılır.) Ancak makalede, modelin bazen nesnelerin belirli kısımlarını kaçırarak bloklu veya bozuk şekillere neden olabileceğini belirtiyorlar.

OpenAI Noktası-E

Görsel Kaynakları: OpenAI

Tek başına duran ağ oluşturma modelinin dışında, Point-E iki modelden oluşur: metinden görüntüye model ve görüntüden 3B’ye model. OpenAI’nin kendi DALL-E 2 ve Stable Diffusion gibi üretici sanat sistemlerine benzeyen metinden görüntüye modeli, sözcükler ve görsel kavramlar arasındaki ilişkileri anlamak için etiketli görüntüler üzerinde eğitildi. Öte yandan, görüntüden 3B modele, 3B nesnelerle eşleştirilmiş bir dizi görüntü beslendi, böylece ikisi arasında etkili bir şekilde çevirmeyi öğrendi.

Bir metin istemi verildiğinde – örneğin, “3B yazdırılabilir bir dişli, 3 inç çapında ve yarım inç kalınlığında tek bir dişli” – Point-E’nin metinden görüntüye modeli, görüntüden görüntüye beslenen sentetik bir işlenmiş nesne oluşturur. Daha sonra bir nokta bulutu oluşturan 3B model.

OpenAI araştırmacıları, “birkaç milyon” 3B nesne ve ilişkili meta verilerden oluşan bir veri kümesi üzerinde modelleri eğittikten sonra, Point-E’nin metin istemleriyle sıklıkla eşleşen renkli nokta bulutları üretebileceğini söylüyor. Mükemmel değil – Point-E’nin görüntüden 3B’ye modeli bazen görüntüyü metinden görüntüye modelden anlayamaz ve bu da metin istemiyle eşleşmeyen bir şekle neden olur. Yine de, en azından OpenAI ekibine göre, önceki son teknolojiden çok daha hızlı.

OpenAI Noktası-E

Point-E nokta bulutlarını ağlara dönüştürme. Görsel Kaynakları: OpenAI

Makalede, “Metodumuz bu değerlendirmede son teknoloji tekniklerden daha kötü performans gösterse de, zamanın küçük bir bölümünde numuneler üretiyor” diye yazdılar. “Bu, belirli uygulamalar için daha pratik hale getirebilir veya daha yüksek kaliteli 3B nesnelerin keşfedilmesine izin verebilir.”

Uygulamalar tam olarak nedir? OpenAI araştırmacıları, Point-E’nin nokta bulutlarının, örneğin 3D baskı yoluyla gerçek dünyadaki nesneleri üretmek için kullanılabileceğine dikkat çekiyor. Ek ağ dönüştürme modeliyle, sistem – biraz daha parlatıldığında – oyun ve animasyon geliştirme iş akışlarına da girebilir.

OpenAI, 3B nesne oluşturucu mücadelesine atlayan en son şirket olabilir, ancak – daha önce ima edildiği gibi – kesinlikle ilk değil. Bu yılın başlarında Google, şirketin 2021’de piyasaya sürdüğü üretken bir 3B sistem olan Dream Fields’ın genişletilmiş bir sürümü olan DreamFusion’ı piyasaya sürdü. Dream Fields’ın aksine DreamFusion önceden eğitim gerektirmez, yani 3B veriler olmadan nesnelerin 3B temsillerini oluşturabilir.

Şu anda tüm gözler 2B sanat üreteçlerindeyken, model sentezleyen yapay zeka, bir sonraki büyük endüstri bozucu olabilir. 3D modeller, film ve TV, iç mimari, mimari ve çeşitli bilim alanlarında yaygın olarak kullanılmaktadır. Örneğin, mimarlık firmaları bunları önerilen binaları ve peyzajları tanıtmak için kullanırken, mühendisler modelleri yeni cihaz, araç ve yapı tasarımları olarak kullanır.

OpenAI Noktası-E

Point-E arıza durumları. Görsel Kaynakları: OpenAI

3B modellerin yapımı genellikle biraz zaman alır – birkaç saatten birkaç güne kadar. Point-E gibi AI, bir gün karışıklıklar çözülürse bunu değiştirebilir ve bunu yaparak OpenAI’yi saygın bir kâr haline getirebilir.

Soru, zaman içinde ne tür fikri mülkiyet anlaşmazlıklarının ortaya çıkabileceğidir. 3D modeller için büyük bir pazar var ve CGStudio ve CreativeMarket dahil olmak üzere, sanatçıların oluşturdukları içeriği satmalarına olanak tanıyan çeşitli çevrimiçi pazar yerleri var. Point-E yakalanırsa ve modelleri pazarlara girerse, model sanatçıları, modern üretken AI’nın eğitim verilerinden (Point-E’nin durumunda mevcut 3D modeller) büyük ölçüde ödünç aldığına dair kanıtlara işaret ederek protesto edebilir. DALL-E 2 gibi, Point-E de nesillerini etkilemiş olabilecek sanatçıların hiçbirine atıfta bulunmaz veya alıntı yapmaz.

Ancak OpenAI bu konuyu başka bir güne bırakıyor. Ne Point-E makalesi ne de GitHub sayfası telif hakkından bahsetmiyor.

Kredilerine göre, araştırmacılar yapmak Point-E’nin acı çekmesini beklediklerinden bahsetmek diğer eğitim verilerinden miras alınan önyargılar ve “tehlikeli nesneler” oluşturmak için kullanılabilecek modeller etrafındaki koruma eksikliği gibi sorunlar. Belki de bu yüzden Point-E’yi, metinden 3B’ye sentez alanında “ilerideki çalışmalara” ilham vereceğini umdukları bir “başlangıç ​​noktası” olarak nitelendirmekte dikkatlidirler.



genel-24