Alibaba’nın Qwen ekibi, Deepseek-R1’e benzer şekilde performans gösterdiği söylenen QWQ-32B açık kaynaklı muhakeme modelini yayınladı

Son güncelleme: 7 Mart 2025 13:53

Yapay Zeka (AI) modelleri geliştirmekle görevli bir bölüm olan Alibaba’nın Qwen ekibi, QWQ-32B AI modelini Çarşamba günü yayınladı. Görünür düşünce zinciri (COT) ile genişletilmiş test süresi hesaplamasına dayanan bir akıl yürütme modelidir. Geliştiriciler, Deepseek-R1’e kıyasla daha küçük boyutta olmasına rağmen, modelin performansıyla karşılaştırma puanlarına göre eşleşebileceğini iddia ediyor. Qwen ekibi tarafından yayınlanan diğer AI modelleri gibi, QWQ-32B de açık kaynaklı bir AI modelidir, ancak tam kaynaklı değildir.

QWQ-32B Akıl Yürütme AI modeli yayınlandı

Bir Blog yazısıAlibaba’nın Qwen ekibi QWQ-32B akıl yürütme modelini detaylandırdı. QWQ (sorularla Qwen kısaltması) Serisi AI modelleri ilk olarak şirket tarafından Kasım 2024’te tanıtıldı. Bu akıl yürütme modelleri, Openai’nin O1 serisi gibi açık kaynaklı bir alternatif sunmak üzere tasarlandı. QWQ-32B, takviye öğrenme (RL) tekniklerinin ölçeklendirilmesi ile geliştirilen 32 milyar parametre modelidir.

Eğitim sürecini açıklayan geliştiriciler, RL ölçeklendirme yaklaşımının soğuk bir başlangıç kontrol noktasına eklendiğini söyledi. Başlangıçta, RL sadece kodlama ve matematikle ilgili görevler için kullanıldı ve doğruluk sağlamak için yanıtlar doğrulandı. Daha sonra teknik, kural tabanlı doğrulayıcılarla birlikte genel yetenekler için kullanılmıştır. Qwen ekibi, bu yöntemin matematik ve kodlama performansını azaltmadan modelin genel yeteneklerini artırdığını buldu.

QWQ-32B AI Model Kıyasları
Fotoğraf kredisi: Alibaba

Geliştiriciler, bu eğitim yapılarının QWQ-32B’nin 671 milyar parametreli bir model olmasına rağmen Deepseek-R1’e benzer seviyelerde performans göstermesini sağladığını iddia ediyor (37 milyar aktif olarak). Dahili testlere dayanarak, ekip QWQ-32B’nin Livebench (kodlama), IFEVAL (sohbet veya talimat ince ayarlı dil) ve Berkeley işlevi çağrısı Lider Tahtası V3 veya BFCL (çağrı işlevleri) kriterlerinde daha iyi performans gösterdiğini iddia etti.

Geliştiriciler ve yapay zeka tutkunları, modelin açık ağırlıklarını sarılma yüz listelemesinde ve modelleri bulabilirler. Model, akademik ve araştırma ile ilgili kullanıma izin veren ancak ticari kullanım durumlarını yasaklayan Apache 2.0 lisansı altında mevcuttur. Ayrıca, tam eğitim detayları ve veri kümeleri mevcut olmadığından, model de tekrarlanamaz veya yapısöktürülebilir. Deepseek-R1 de aynı lisans altında mevcuttu.

Birinin AI modelini yerel olarak çalıştırmak için doğru donanımdan yoksun olması durumunda, Qwen Chat aracılığıyla yeteneklerine de erişebilirler. Sayfanın sol üst kısmındaki model seçici menüsü, kullanıcıların QWQ-32B önlem modelini seçmesine izin verecektir.

Barcelona’daki Mobil Dünya Kongresi’ndeki Samsung, Xiaomi, Realme, OnePlus, Oppo ve diğer şirketlerden gelen son lansmanların ve haberlerin ayrıntıları için MWC 2025 merkezimizi ziyaret edin.

genel-8

Bu Makaleyi Paylaş

Önceki Makale

Dünya’yı incelemek için iletişim uydularını kullanmak

Sonraki Makale Rusya Federasyonu bayilerinde yeni Zeekr 7x 2025 var – Çin ve Avrupa’da fiyatlar bizimle ne kadar var

Alibaba’nın Qwen ekibi, Deepseek-R1’e benzer şekilde performans gösterdiği söylenen QWQ-32B açık kaynaklı muhakeme modelini yayınladı

QWQ-32B Akıl Yürütme AI modeli yayınlandı

Sanal Medya

Son Eklenenler

Yeni Toy Defense Kodları ile Stratejinizi Güçlendirin

YouTube, AI içerikler ve rahatsız edici videolar için yeni kurallar getiriyor

Hollanda çip sektörü, Çin müdahalesi riski altında; daha sıkı denetim çağrısı

Acil: HollowGraph Malware, Microsoft 365’te 2050’ye Gizleniyor!

Adobe Kamera Uygulaması Yeni Özelliğiyle Fotoğraflarınıza Yapay Zeka ile Değerlendirme Yapacak

AI Tepkisi ve ‘Yapay Devlet’ Üzerine Dr. Jill Lepore’nin Görüşleri

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer