Hugging Face, Verimliliğe Odaklanmış Açık Kaynak SmolVLM Vizyon Dili Modelini Tanıtıyor

Yapay zeka (AI) ve makine öğrenimi (ML) platformu Hugging Face, geçtiğimiz hafta vizyon odaklı yeni bir yapay zeka modelini tanıttı. SmolVLM (VLM, görme dili modelinin kısaltmasıdır) olarak adlandırılan bu model, verimliliğe odaklanan kompakt boyutlu bir modeldir. Şirket, daha küçük boyutu ve yüksek verimliliği nedeniyle, altyapısına çok fazla yatırım yapmadan yapay zeka yetenekleri isteyen işletmeler ve yapay zeka meraklıları için faydalı olabileceğini iddia ediyor. Hugging Face ayrıca SmolVLM görüş modelini hem kişisel hem de ticari kullanım için Apache 2.0 lisansı altında açık kaynak olarak sağlamıştır.

Sarılma Yüzü SmolVLM’yi Tanıtıyor

bir blog yazısıHugging Face, yeni açık kaynaklı görüş modelini detaylandırdı. Şirket, belleğin verimli kullanımı ve hızlı çıkarımı nedeniyle yapay zeka modelini “son teknoloji ürünü” olarak adlandırdı. Küçük bir vizyon modelinin kullanışlılığını vurgulayan şirket, yapay zeka şirketlerinin modelleri daha verimli ve uygun maliyetli hale getirmek için ölçeklerini küçülttüğü son trende dikkat çekti.

Küçük görüş modeli ekosistemi
Fotoğraf Kredisi: Sarılma Yüzü

SmolVLM ailesi, her biri iki milyar parametreye sahip üç yapay zeka modeli çeşidine sahiptir. Bunlardan ilki standart model olan SmolVLM-Base’dir. Bunun dışında SmolVLM-Synthetic, sentetik veriler (yapay zeka veya bilgisayar tarafından oluşturulan veriler) üzerinde eğitilmiş ince ayarlı varyanttır ve SmolVLM Instruct, son kullanıcı merkezli uygulamalar oluşturmak için kullanılabilecek talimat varyantıdır.

Teknik ayrıntılara gelecek olursak, Vision modeli yalnızca 5,02 GB GPU RAM ile çalışabiliyor; bu, Qwen2-VL 2B’nin 13,7 GB GPU RAM ve InternVL2 2B’nin 10,52 GB GPU RAM gereksiniminden önemli ölçüde daha düşük. Bu nedenle Hugging Face, AI modelinin bir dizüstü bilgisayardaki cihazda çalışabileceğini iddia ediyor.

SmolVLM, herhangi bir sırayla bir dizi metin ve görüntüyü kabul edebilir ve kullanıcı sorgularına yanıtlar oluşturmak için bunları analiz edebilir. 384 x 384p çözünürlüklü görüntü yamalarını 81 görsel veri jetonuna kodlar. Şirket, bunun, Qwen2-VL’nin gerektirdiği 16.000 jetonun aksine, AI’nın test istemlerini ve tek bir görüntüyü 1.200 jetonla kodlamasına olanak tanıdığını iddia etti.

Bu spesifikasyonlarla Hugging Face, SmolVLM’nin küçük işletmeler ve yapay zeka meraklıları tarafından kolaylıkla kullanılabileceğini ve teknoloji yığınının büyük bir yükseltme gerektirmeden yerelleştirilmiş sistemlere dağıtılabileceğini vurguluyor. Kuruluşlar ayrıca metin ve görüntü tabanlı çıkarımlar için yapay zeka modelini önemli maliyetlere katlanmadan çalıştırabilecek.

En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin X, Facebook, WhatsApp, Konular Ve Google Haberler. Cihazlar ve teknolojiyle ilgili en son videolar için abone olun YouTube kanalı. En iyi etkileyiciler hakkında her şeyi bilmek istiyorsanız şirket içi bölümümüzü takip edin O Kim360 Açık instagram Ve YouTube.

Vivo X200 ve Vivo X200 Pro’nun Aralık’ın İkinci Haftasında Hindistan’da Resmi Olacağı İddia Edildi; Satış Tarihi Sızdı

BRICS’in Dolarizasyondan Arındırmaya Yönelik Dijital Varlıklar Platformunu Tanıtma Hamlesi Trump’tan Eleştirilere Yol Açtı

genel-8

Yazı gezinmesi

Bu Siber Pazartesi günü RTX 4090 almanın en iyi yolu mu? Önceden oluşturulmuş bir masaüstü satın alın
OnePlus 13 Sonunda Gerçekten Suya Dayanıklı Olacak

Hugging Face, Verimliliğe Odaklanmış Açık Kaynak SmolVLM Vizyon Dili Modelini Tanıtıyor

Byteknomers

Sarılma Yüzü SmolVLM’yi Tanıtıyor

By teknomers

Benzer İçerikler

Amazon, veri merkezlerinden birinde havadaki CO2’yi ortadan kaldırmak için Orbital ile iş birliği yapıyor

Müzikteki yılınızın ayrıntılı bir görünümünü sunan Apple Music Replay 2024 artık kullanıma sunuldu

Disney’in ‘Pamuk Prenses’i: Rachel Zegler, Resmi Fragmanla Gal Gadot’nun Kötü Kraliçesinden Krallığı Geri Kazanıyor

Stalker 2’nin 3 Aralık Yeni Güncellemesi 1.0.3 Sürümünü Getiriyor

Cosy Game’in Yeni Lansman Fragmanı Geldiğinden Şimdi Infinity Nikki’yi Önceden Yükleyebilirsiniz

Nintendo Switch Online önümüzdeki hafta Tetris’in NES versiyonunu alacak

Dev Firebirds güncellemesinde War Thunder büyüyor (ve daha da güzelleşiyor)

Apple’ın 10. Nesil iPad’i en düşük Kara Cuma fiyatıyla satışa devam ediyor, ancak bu kesinlikle uzun sürmeyecek

Özgür kalmak istiyorum: Huawei’nin Android’e toleranssız Mate 70’i başparmaklarımı kaldırıyor

iPhone küresel premium akıllı telefon pazarına hakim durumda

Bir telefon uzmanı olarak Amazon’da hala 279 $ indirimli iken Pixel 8 Pro’yu almanızı tavsiye ederim

İlkel kara deliklerin kanıtları gezegenlerde, hatta Dünya’daki gündelik nesnelerde saklanıyor olabilir

Uzay habitatları oluşturmak için yeniden yapılandırılabilir yeni bir yapı kullanılabilir

Evrenin yeni haritası, gizli kara delikleri ve kozmik yapıyı ortaya çıkarmak için yerçekimi dalgalarını kullanıyor

Axion karanlık maddesi uzay-zaman halkası oluşturabilir

İlginizi Çekebilir

Amazon, veri merkezlerinden birinde havadaki CO2’yi ortadan kaldırmak için Orbital ile iş birliği yapıyor

Fallout 76 Gleaming Depths Güncellemesi Artık Yayında, Şimdiye Kadarki En Büyük Patronu Ekliyor

Touch Bar geri döndü bir nevi… ve berbat görünüyor

Müzikteki yılınızın ayrıntılı bir görünümünü sunan Apple Music Replay 2024 artık kullanıma sunuldu