Yapay zeka (AI) ve makine öğrenimi (ML) platformu Hugging Face, geçtiğimiz hafta vizyon odaklı yeni bir yapay zeka modelini tanıttı. SmolVLM (VLM, görme dili modelinin kısaltmasıdır) olarak adlandırılan bu model, verimliliğe odaklanan kompakt boyutlu bir modeldir. Şirket, daha küçük boyutu ve yüksek verimliliği nedeniyle, altyapısına çok fazla yatırım yapmadan yapay zeka yetenekleri isteyen işletmeler ve yapay zeka meraklıları için faydalı olabileceğini iddia ediyor. Hugging Face ayrıca SmolVLM görüş modelini hem kişisel hem de ticari kullanım için Apache 2.0 lisansı altında açık kaynak olarak sağlamıştır.

Sarılma Yüzü SmolVLM’yi Tanıtıyor

bir blog yazısıHugging Face, yeni açık kaynaklı görüş modelini detaylandırdı. Şirket, belleğin verimli kullanımı ve hızlı çıkarımı nedeniyle yapay zeka modelini “son teknoloji ürünü” olarak adlandırdı. Küçük bir vizyon modelinin kullanışlılığını vurgulayan şirket, yapay zeka şirketlerinin modelleri daha verimli ve uygun maliyetli hale getirmek için ölçeklerini küçülttüğü son trende dikkat çekti.

sarılma yüz svm ekosistemi Küçük görüş modeli ekosistemi

Küçük görüş modeli ekosistemi
Fotoğraf Kredisi: Sarılma Yüzü

SmolVLM ailesi, her biri iki milyar parametreye sahip üç yapay zeka modeli çeşidine sahiptir. Bunlardan ilki standart model olan SmolVLM-Base’dir. Bunun dışında SmolVLM-Synthetic, sentetik veriler (yapay zeka veya bilgisayar tarafından oluşturulan veriler) üzerinde eğitilmiş ince ayarlı varyanttır ve SmolVLM Instruct, son kullanıcı merkezli uygulamalar oluşturmak için kullanılabilecek talimat varyantıdır.

Teknik ayrıntılara gelecek olursak, Vision modeli yalnızca 5,02 GB GPU RAM ile çalışabiliyor; bu, Qwen2-VL 2B’nin 13,7 GB GPU RAM ve InternVL2 2B’nin 10,52 GB GPU RAM gereksiniminden önemli ölçüde daha düşük. Bu nedenle Hugging Face, AI modelinin bir dizüstü bilgisayardaki cihazda çalışabileceğini iddia ediyor.

SmolVLM, herhangi bir sırayla bir dizi metin ve görüntüyü kabul edebilir ve kullanıcı sorgularına yanıtlar oluşturmak için bunları analiz edebilir. 384 x 384p çözünürlüklü görüntü yamalarını 81 görsel veri jetonuna kodlar. Şirket, bunun, Qwen2-VL’nin gerektirdiği 16.000 jetonun aksine, AI’nın test istemlerini ve tek bir görüntüyü 1.200 jetonla kodlamasına olanak tanıdığını iddia etti.

Bu spesifikasyonlarla Hugging Face, SmolVLM’nin küçük işletmeler ve yapay zeka meraklıları tarafından kolaylıkla kullanılabileceğini ve teknoloji yığınının büyük bir yükseltme gerektirmeden yerelleştirilmiş sistemlere dağıtılabileceğini vurguluyor. Kuruluşlar ayrıca metin ve görüntü tabanlı çıkarımlar için yapay zeka modelini önemli maliyetlere katlanmadan çalıştırabilecek.

En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin X, Facebook, WhatsApp, Konular Ve Google Haberler. Cihazlar ve teknolojiyle ilgili en son videolar için abone olun YouTube kanalı. En iyi etkileyiciler hakkında her şeyi bilmek istiyorsanız şirket içi bölümümüzü takip edin O Kim360 Açık instagram Ve YouTube.

Vivo X200 ve Vivo X200 Pro’nun Aralık’ın İkinci Haftasında Hindistan’da Resmi Olacağı İddia Edildi; Satış Tarihi Sızdı


BRICS’in Dolarizasyondan Arındırmaya Yönelik Dijital Varlıklar Platformunu Tanıtma Hamlesi Trump’tan Eleştirilere Yol Açtı





genel-8