Yapay Zeka (AI) modelleri geliştirmekle görevli bir bölüm olan Alibaba’nın Qwen ekibi, QWQ-32B AI modelini Çarşamba günü yayınladı. Görünür düşünce zinciri (COT) ile genişletilmiş test süresi hesaplamasına dayanan bir akıl yürütme modelidir. Geliştiriciler, Deepseek-R1’e kıyasla daha küçük boyutta olmasına rağmen, modelin performansıyla karşılaştırma puanlarına göre eşleşebileceğini iddia ediyor. Qwen ekibi tarafından yayınlanan diğer AI modelleri gibi, QWQ-32B de açık kaynaklı bir AI modelidir, ancak tam kaynaklı değildir.
QWQ-32B Akıl Yürütme AI modeli yayınlandı
Bir Blog yazısıAlibaba’nın Qwen ekibi QWQ-32B akıl yürütme modelini detaylandırdı. QWQ (sorularla Qwen kısaltması) Serisi AI modelleri ilk olarak şirket tarafından Kasım 2024’te tanıtıldı. Bu akıl yürütme modelleri, Openai’nin O1 serisi gibi açık kaynaklı bir alternatif sunmak üzere tasarlandı. QWQ-32B, takviye öğrenme (RL) tekniklerinin ölçeklendirilmesi ile geliştirilen 32 milyar parametre modelidir.
Eğitim sürecini açıklayan geliştiriciler, RL ölçeklendirme yaklaşımının soğuk bir başlangıç kontrol noktasına eklendiğini söyledi. Başlangıçta, RL sadece kodlama ve matematikle ilgili görevler için kullanıldı ve doğruluk sağlamak için yanıtlar doğrulandı. Daha sonra teknik, kural tabanlı doğrulayıcılarla birlikte genel yetenekler için kullanılmıştır. Qwen ekibi, bu yöntemin matematik ve kodlama performansını azaltmadan modelin genel yeteneklerini artırdığını buldu.
![]()
QWQ-32B AI Model Kıyasları
Fotoğraf kredisi: Alibaba
Geliştiriciler, bu eğitim yapılarının QWQ-32B’nin 671 milyar parametreli bir model olmasına rağmen Deepseek-R1’e benzer seviyelerde performans göstermesini sağladığını iddia ediyor (37 milyar aktif olarak). Dahili testlere dayanarak, ekip QWQ-32B’nin Livebench (kodlama), IFEVAL (sohbet veya talimat ince ayarlı dil) ve Berkeley işlevi çağrısı Lider Tahtası V3 veya BFCL (çağrı işlevleri) kriterlerinde daha iyi performans gösterdiğini iddia etti.
Geliştiriciler ve yapay zeka tutkunları, modelin açık ağırlıklarını sarılma yüz listelemesinde ve modelleri bulabilirler. Model, akademik ve araştırma ile ilgili kullanıma izin veren ancak ticari kullanım durumlarını yasaklayan Apache 2.0 lisansı altında mevcuttur. Ayrıca, tam eğitim detayları ve veri kümeleri mevcut olmadığından, model de tekrarlanamaz veya yapısöktürülebilir. Deepseek-R1 de aynı lisans altında mevcuttu.
Birinin AI modelini yerel olarak çalıştırmak için doğru donanımdan yoksun olması durumunda, Qwen Chat aracılığıyla yeteneklerine de erişebilirler. Sayfanın sol üst kısmındaki model seçici menüsü, kullanıcıların QWQ-32B önlem modelini seçmesine izin verecektir.
Barcelona’daki Mobil Dünya Kongresi’ndeki Samsung, Xiaomi, Realme, OnePlus, Oppo ve diğer şirketlerden gelen son lansmanların ve haberlerin ayrıntıları için MWC 2025 merkezimizi ziyaret edin.

