
Alibaba’nın Qwen araştırma ekibi, önizleme aşamasında başka bir açık kaynaklı yapay zeka (AI) modelini yayınladı. QVQ-72B olarak adlandırılan bu model, görüntülerden gelen görsel bilgileri analiz edebilen ve bunların arkasındaki bağlamı anlayabilen, vizyona dayalı bir akıl yürütme modelidir. Teknoloji devi ayrıca AI modelinin kıyaslama puanlarını paylaştı ve belirli bir testte OpenAI’nin o1 modelinden daha iyi performans gösterdiğini vurguladı. Alibaba, yakın zamanda QwQ-32B ve Marco-o1 muhakeme odaklı büyük dil modelleri (LLM’ler) dahil olmak üzere birçok açık kaynaklı yapay zeka modelini piyasaya sürdü.
Alibaba’nın Vizyon Tabanlı QVQ-72B Yapay Zeka Modeli Piyasaya Sürüldü
Sarılma Yüzünde listelemeAlibaba’nın Qwen ekibi yeni açık kaynaklı yapay zeka modelini detaylandırdı. Bunu deneysel bir araştırma modeli olarak adlandıran araştırmacılar, QVQ-72B’nin gelişmiş görsel muhakeme yetenekleriyle birlikte geldiğini vurguladı. İlginç bir şekilde bunlar, araştırmacıların bu modelde birleştirdiği iki ayrı performans dalıdır.
Vizyon tabanlı yapay zeka modelleri oldukça fazla. Bunlar bir görüntü kodlayıcı içerir ve arkalarındaki görsel bilgileri ve bağlamı analiz edebilir. Benzer şekilde, o1 ve QwQ-32B gibi akıl yürütme odaklı modeller, modelin işlem süresini artırmalarına olanak tanıyan test süresi hesaplama ölçeklendirme yetenekleriyle birlikte gelir. Bu, modelin sorunu parçalara ayırmasına, adım adım çözmesine, çıktıyı değerlendirmesine ve bir doğrulayıcıya göre düzeltmesine olanak tanır.
Alibaba, QVQ-72B’nin önizleme modeliyle bu iki işlevi birleştirdi. Artık görüntülerden gelen bilgileri analiz edebiliyor ve akıl yürütme odaklı yapıları kullanarak karmaşık sorguları yanıtlayabiliyor. Ekip, modelin performansını önemli ölçüde iyileştirdiğinin altını çiziyor.
Dahili testlerden elde edilen değerlendirmeleri paylaşan araştırmacılar, QVQ-72B’nin MathVista (mini) karşılaştırmasında yüzde 71,4 puan alarak o1 modelinden (71,0) daha iyi performans gösterdiğini iddia etti. Ayrıca Multimodal Massive Multi-task Understanding (MMMU) kriterinde de yüzde 70,3 puan aldığı söyleniyor.
Geliştirilmiş performansa rağmen çoğu deneysel modelde olduğu gibi çeşitli sınırlamalar vardır. Qwen ekibi, yapay zeka modelinin zaman zaman farklı dilleri karıştırdığını veya beklenmedik bir şekilde bunlar arasında geçiş yaptığını belirtti. Modelde kod değiştirme sorunu da ön plana çıkıyor. Ek olarak model, yinelenen akıl yürütme döngülerine yakalanma ve nihai çıktıyı etkileme eğilimindedir.

