Alibaba Araştırmacıları, OpenAI’nin o1’inin Mantık Odaklı Bir Başka Rakibi Olarak Marco-o1 Yapay Zeka Modelini Açıkladı

Son güncelleme: 2 Aralık 2024 14:28

Alibaba yakın zamanda Marco-o1 adlı akıl yürütme odaklı bir yapay zeka (AI) modelini tanıttı. Model, gelişmiş muhakeme yetenekleri gerektiren görevler için de optimize edilmiş olan QwQ-32B büyük dil modeline benzer; ancak önemli bir ayrım, Marco-o1’in daha küçük bir model olması ve Qwen2-7B-Instruct modelinden damıtılmış olmasıdır. . Çinli teknoloji devi, yeni modeli akıl yürütme odaklı hale getirmek için çeşitli ince ayar alıştırmalarının kullanıldığını iddia etti. Ek olarak araştırmacılar, bunun gerçek dünyadaki karmaşık problem çözme görevleri için optimize edildiğinin altını çizdi.

Alibaba Marco-o1 Yapay Zeka Modeli

Yeni yapay zeka modeli bir araştırmada detaylandırıldı kağıt çevrimiçi bir ön baskı dergisi olan arXiv’de yayınlandı. Özellikle, çevrimiçi dergide yayınlanan makaleler hakemli değildir. Ayrıca Alibaba’nın da barındırılan Hugging Face’teki AI modelini kullanıyor ve Apache 2.0 lisansı kapsamında kişisel ve ticari kullanım durumları için indirilmesine ve kullanılmasına izin veriyor.

Ancak yalnızca kısmi veri kümesi kullanıma sunulduğundan tamamen açık kaynaklı değildir. Bu nedenle, kullanıcılar modeli kopyalayamayacak veya mimariyi veya bileşenleri analiz etmek için parçalara ayıramayacaktır.

Marco-o1’e gelince, Qwen2-7B-Instruct temel modelinden ince ayar yapılmıştır. Makalede araştırmacılar, yapay zeka modelinin düşünce zinciri (CoT) ince ayarı, Monte Carlo Ağaç Araması (MCTS), yansıma mekanizmaları ve diğer akıl yürütme stratejileri tarafından desteklendiğini vurguladı.

Sonuç olarak, Alibaba’nın Marco-o1’i açık uçlu soruları çözebilir ve “açık standartların bulunmadığı ve ödüllerin ölçülmesinin zor olduğu durumlarda” yanıtlara yönelik sorgular bulabilir. Ancak şunu da anlamak gerekir ki ileri muhakeme yetenekleri herhangi bir donanım veya mimari ilerlemeden kaynaklanmamıştır.

Bunun yerine, günümüzde tüm muhakeme modelleri, yapay zeka modelinin tek bir sorguda daha fazla işlem süresi harcamasına olanak tanıyan, test süresi hesaplaması adı verilen bir teknik kullanıyor. Bu onların çözümü bulmak için farklı teorileri test etmelerine ve kendilerinin doğruluğunu kontrol etmelerine olanak tanır. Sonuç olarak, bu modeller daha doğru yanıtlar sağlamaya ve karmaşık görevleri tamamlamaya yöneliktir. Araştırmacılara göre Marco-o1’in üstün olduğu önemli alanlardan biri de konuşma dilindeki nüansları anlamak ve argo ifadeleri tercüme etmek.

Araştırmacılara göre yapay zeka modelinin bir sınırlaması, Marco-o1’in muhakeme özellikleri göstermesine rağmen “performansının hala tam olarak gerçekleştirilmiş bir akıl yürütme modelinin altında kaldığı” iddia edildi.

genel-8

Bu Makaleyi Paylaş

Önceki Makale Helldivers 2, TIGA Ödülleri 2024’te GOTY’yi Kazandı

Sonraki Makale

Gelecek yıl Windows 10 desteğinin sona ereceğini duymaktan bıktınız mı? Kötü haber – Microsoft, Windows 11 yükseltme kampanyasını hızlandırdı

Alibaba Araştırmacıları, OpenAI’nin o1’inin Mantık Odaklı Bir Başka Rakibi Olarak Marco-o1 Yapay Zeka Modelini Açıkladı

Alibaba Marco-o1 Yapay Zeka Modeli

Sanal Medya

Son Eklenenler

Apple WWDC 2026 Canlı Yayını: Tüm Yenilikler ve Beklentiler Burada!

Massachusetts’ten Yeni Gizlilik Hakları Yasasıyla Önemli Adım

Uygun fiyatlı, ama performans ve özellik yönünden zayıf 5G hotspot incelemesi

Kazutoki Kono’nun Gece Yarısı Çalışmalarıyla Oyun Heyecanı Artıyor

Kritik: AI Kimlik Avı ile SOC Aşırı Yüklenmesini Azaltma Yolları

WebSocket Olmadan Bildirimler: Uygulama İçi Merkez ve Paylaşımlı Hosting Üzerinde Yayınlar

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer