Alibaba yakın zamanda Marco-o1 adlı akıl yürütme odaklı bir yapay zeka (AI) modelini tanıttı. Model, gelişmiş muhakeme yetenekleri gerektiren görevler için de optimize edilmiş olan QwQ-32B büyük dil modeline benzer; ancak önemli bir ayrım, Marco-o1’in daha küçük bir model olması ve Qwen2-7B-Instruct modelinden damıtılmış olmasıdır. . Çinli teknoloji devi, yeni modeli akıl yürütme odaklı hale getirmek için çeşitli ince ayar alıştırmalarının kullanıldığını iddia etti. Ek olarak araştırmacılar, bunun gerçek dünyadaki karmaşık problem çözme görevleri için optimize edildiğinin altını çizdi.

Alibaba Marco-o1 Yapay Zeka Modeli

Yeni yapay zeka modeli bir araştırmada detaylandırıldı kağıt çevrimiçi bir ön baskı dergisi olan arXiv’de yayınlandı. Özellikle, çevrimiçi dergide yayınlanan makaleler hakemli değildir. Ayrıca Alibaba’nın da barındırılan Hugging Face’teki AI modelini kullanıyor ve Apache 2.0 lisansı kapsamında kişisel ve ticari kullanım durumları için indirilmesine ve kullanılmasına izin veriyor.

Ancak yalnızca kısmi veri kümesi kullanıma sunulduğundan tamamen açık kaynaklı değildir. Bu nedenle, kullanıcılar modeli kopyalayamayacak veya mimariyi veya bileşenleri analiz etmek için parçalara ayıramayacaktır.

Marco-o1’e gelince, Qwen2-7B-Instruct temel modelinden ince ayar yapılmıştır. Makalede araştırmacılar, yapay zeka modelinin düşünce zinciri (CoT) ince ayarı, Monte Carlo Ağaç Araması (MCTS), yansıma mekanizmaları ve diğer akıl yürütme stratejileri tarafından desteklendiğini vurguladı.

Sonuç olarak, Alibaba’nın Marco-o1’i açık uçlu soruları çözebilir ve “açık standartların bulunmadığı ve ödüllerin ölçülmesinin zor olduğu durumlarda” yanıtlara yönelik sorgular bulabilir. Ancak şunu da anlamak gerekir ki ileri muhakeme yetenekleri herhangi bir donanım veya mimari ilerlemeden kaynaklanmamıştır.

Bunun yerine, günümüzde tüm muhakeme modelleri, yapay zeka modelinin tek bir sorguda daha fazla işlem süresi harcamasına olanak tanıyan, test süresi hesaplaması adı verilen bir teknik kullanıyor. Bu onların çözümü bulmak için farklı teorileri test etmelerine ve kendilerinin doğruluğunu kontrol etmelerine olanak tanır. Sonuç olarak, bu modeller daha doğru yanıtlar sağlamaya ve karmaşık görevleri tamamlamaya yöneliktir. Araştırmacılara göre Marco-o1’in üstün olduğu önemli alanlardan biri de konuşma dilindeki nüansları anlamak ve argo ifadeleri tercüme etmek.

Araştırmacılara göre yapay zeka modelinin bir sınırlaması, Marco-o1’in muhakeme özellikleri göstermesine rağmen “performansının hala tam olarak gerçekleştirilmiş bir akıl yürütme modelinin altında kaldığı” iddia edildi.



genel-8