Meta ImageBind: Facebook ebeveyninin yeni AI modeli nedir?

Facebook ebeveyn Meta yapay zeka (AI) konusunda Google ve Microsoft kadar iyimser görünüyor. Şirket, ürünlerini ortaya çıkarıyor, test ediyor ve açık kaynak kullanıyor. AI modeliS. Son gelişmede şirket, Meta adlı yeni bir açık kaynaklı AI modelini duyurdu. GörüntüBinddeneyimler yaratmak için farklı duyuları (kesin olmak gerekirse altı) birleştirir.

Meta CEO’su Mark Zuckerberg, duyuruyu bir Instagram Kanalında yaptı ve ayrıca modelin çalışmasını anlatan bir video paylaştı.

“Bugün, tıpkı insanlar gibi farklı duyuları birleştiren yeni bir AI modeli olan ImageBind’i açık kaynak olarak kullanıyoruz. Görüntüleri, videoyu, sesi, derinliği, termal ve uzamsal hareketi anlar. Zuckerberg, şu anda neler yapabileceğine dair bazı örnekler için videoyu izleyin ve hepinizin onunla neler inşa edeceğinizi görmek için sabırsızlanıyorum” dedi.

Meta ImageBind nasıl çalışır?
Bu noktada bir araştırma projesi olan proje, sürükleyici, çok duyumlu deneyimler oluşturmak için üretken yapay zekayı kullanabilir. ImageBind AI modeli altı tür bilgiyi bağlayabilir: metin, görüntü/video, ses, derinlik (3D), termal (kızılötesi radyasyon) ve atalet ölçüm birimleri (IMU). Termal ve atalet birimleri hareket ve konumu hesaplayabilir.

Şirket, “ImageBind, makineleri bir fotoğraftaki nesneleri nasıl ses çıkaracakları, 3B şekilleri, ne kadar sıcak veya soğuk oldukları ve nasıl hareket ettikleri ile birleştiren bütünsel bir anlayışla donatıyor” dedi.

Örneğin, modele bir kaplan resmi ve bir şelale sesi verirseniz, bu girdi verilerini birleştirerek her iki öğeyi de içeren bir video oluşturur. “Küçük yaratık” (metin), “yağmur ormanı” (görüntü), “yağmur” (ses) ve bir kuş fotoğrafı (IMU) gibi bir model girişi verirseniz, bunları birleştirerek bir video oluşturur.

“ImageBind, Meta’nın etraflarındaki olası tüm veri türlerinden öğrenen çok modlu yapay zeka sistemleri oluşturma çabalarının bir parçasıdır. Modalitelerin sayısı arttıkça ImageBind, araştırmacıların sürükleyici, sanal dünyalar tasarlamak veya deneyimlemek için 3D ve IMU sensörlerini birleştirmek gibi yeni, bütünsel sistemler geliştirmeye çalışması için taşkın kapılarını açıyor” dedi.

Meta, ImageBind’in aynı zamanda anıları keşfetmek için bir yol sağlayabileceğini söyledi – metin, ses ve görüntünün bir kombinasyonunu kullanarak resimler, videolar, ses dosyaları veya metin mesajları aramak.

FacebooktwitterLinkedin




genel-9