Alibaba’nın Qwen Ekibi, QVQ-72B Açık Kaynaklı Vision Yapay Zeka Modelini Önizlemede Yayınladı

Son güncelleme: 29 Aralık 2024 06:09

Alibaba’nın Qwen araştırma ekibi, önizleme aşamasında başka bir açık kaynaklı yapay zeka (AI) modelini yayınladı. QVQ-72B olarak adlandırılan bu model, görüntülerden gelen görsel bilgileri analiz edebilen ve bunların arkasındaki bağlamı anlayabilen, vizyona dayalı bir akıl yürütme modelidir. Teknoloji devi ayrıca AI modelinin kıyaslama puanlarını paylaştı ve belirli bir testte OpenAI’nin o1 modelinden daha iyi performans gösterdiğini vurguladı. Alibaba, yakın zamanda QwQ-32B ve Marco-o1 muhakeme odaklı büyük dil modelleri (LLM’ler) dahil olmak üzere birçok açık kaynaklı yapay zeka modelini piyasaya sürdü.

Alibaba’nın Vizyon Tabanlı QVQ-72B Yapay Zeka Modeli Piyasaya Sürüldü

Sarılma Yüzünde listelemeAlibaba’nın Qwen ekibi yeni açık kaynaklı yapay zeka modelini detaylandırdı. Bunu deneysel bir araştırma modeli olarak adlandıran araştırmacılar, QVQ-72B’nin gelişmiş görsel muhakeme yetenekleriyle birlikte geldiğini vurguladı. İlginç bir şekilde bunlar, araştırmacıların bu modelde birleştirdiği iki ayrı performans dalıdır.

Vizyon tabanlı yapay zeka modelleri oldukça fazla. Bunlar bir görüntü kodlayıcı içerir ve arkalarındaki görsel bilgileri ve bağlamı analiz edebilir. Benzer şekilde, o1 ve QwQ-32B gibi akıl yürütme odaklı modeller, modelin işlem süresini artırmalarına olanak tanıyan test süresi hesaplama ölçeklendirme yetenekleriyle birlikte gelir. Bu, modelin sorunu parçalara ayırmasına, adım adım çözmesine, çıktıyı değerlendirmesine ve bir doğrulayıcıya göre düzeltmesine olanak tanır.

Alibaba, QVQ-72B’nin önizleme modeliyle bu iki işlevi birleştirdi. Artık görüntülerden gelen bilgileri analiz edebiliyor ve akıl yürütme odaklı yapıları kullanarak karmaşık sorguları yanıtlayabiliyor. Ekip, modelin performansını önemli ölçüde iyileştirdiğinin altını çiziyor.

Dahili testlerden elde edilen değerlendirmeleri paylaşan araştırmacılar, QVQ-72B’nin MathVista (mini) karşılaştırmasında yüzde 71,4 puan alarak o1 modelinden (71,0) daha iyi performans gösterdiğini iddia etti. Ayrıca Multimodal Massive Multi-task Understanding (MMMU) kriterinde de yüzde 70,3 puan aldığı söyleniyor.

Geliştirilmiş performansa rağmen çoğu deneysel modelde olduğu gibi çeşitli sınırlamalar vardır. Qwen ekibi, yapay zeka modelinin zaman zaman farklı dilleri karıştırdığını veya beklenmedik bir şekilde bunlar arasında geçiş yaptığını belirtti. Modelde kod değiştirme sorunu da ön plana çıkıyor. Ek olarak model, yinelenen akıl yürütme döngülerine yakalanma ve nihai çıktıyı etkileme eğilimindedir.

genel-8

Bu Makaleyi Paylaş

Önceki Makale Onsuz asla oyun oynamayacağım fare şu anda 80$ indirimli. Kolay bir yükseltme arayan ciddi PC oyuncularının mutlaka satın alması gereken bir ürün olmasının nedeni budur.

Sonraki Makale

Tottenham-Wolves canlı akışı: Premier Lig maçı nasıl izlenir

Alibaba’nın Qwen Ekibi, QVQ-72B Açık Kaynaklı Vision Yapay Zeka Modelini Önizlemede Yayınladı

Alibaba’nın Vizyon Tabanlı QVQ-72B Yapay Zeka Modeli Piyasaya Sürüldü

Sanal Medya

Son Eklenenler

Laravel Boost’u Neo4j MCP ile Geliştirin🚀

Call of Duty Filmi İçin Ortamına Dair Önemli Gelişme

Marvel Tutkunları İçin Yeni Hot Toys Figürü Heyecan Veriyor

2026’da Dubai İşletmelerinin Özel Web Uygulamalarına İhtiyacı Var: Bir Geliştiricinin Dürüst Değerlendirmesi

Acil: JadePuffer Saldırıları Artık AI Model Verilerini Hedef Alıyor

Yeni Game of Thrones Oyunu Ertelendi: Bekleyiş Devam Ediyor

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer