
Matematik, bilim ve kodlama da dahil olmak üzere, Openai’nin O1 O1 akıl yürütme modelini aşan Deepseek ve R1 V3 destekli AI modelinin ortaya çıkması, yatırımcının AI gelişmelerinin arkasındaki fahiş maliyetle ilgili endişelerini dile getirdi. Openai’nin 500 milyar dolarlık Stargate projesi gibi karşı üretken görünüyor.
Stanford ve Washington Üniversitesi’ndeki araştırmacılar yakın zamanda Openai’nin O1 akıl yürütme modelini ele geçirmek için bir AI modeli geliştirdiler. Daha fazla bağlam için, model, Dublajlı S150 doların altında ( TechCrunch). Araştırmacılar, tescilli daha büyük AI modellerinden bilgi damıtarak bu kilometre taşını elde etmeyi başardılar.
Damıtma, küçük bir AI modelinin daha büyük AI modellerinden bilgi çıkardığı işlemdir. Bu durumda, araştırmacılar S1’in cevaplarını Google’ın Gemini 2.0 Flash Düşünme Deneysel AI akıl yürütme modelinden çıkardığını belirtti. Benekli olduğu gibi Eşekalet Hizmet Şartları Kategorik olarak, şirketin AI modelleriyle rekabet eden modeller geliştirmek için Gemini’nin API’sını kullanmanın yasak olduğunu belirtin.
Süreç, AI girişimleri ve iyi kurulmuş AI firmaları arasındaki boşluğu daraltır, çünkü arkayı kırmadan sofistike girişler geliştirebilirler. Bununla birlikte, Openai ve Microsoft dahil olmak üzere en iyi AI laboratuvarları, AI modellerini geliştirmek için damıtma kullanan daha küçük AI girişimlerinden memnun değildir. Openai ve Microsoft kısa süre önce Deepseek’i telif hakkıyla korunan verilerini ultra maliyetli modelini eğitmek için kullanmakla suçladı.
S1’in eğitim süreci 16 NVIDIA H100 GPU’yu kullanarak 30 dakikadan az sürdü. Model, açık kaynaklı bir Alibaba AI modeli olan Qwen2.5’e dayanmaktadır. Daha ilginç bir şekilde, araştırmacılar AI modelinden akıl yürütme süreci sırasında “beklemelerini” istediklerini ve sorguya verdiği yanıt vermeden önce daha fazla düşünmesini istediklerini açıkladılar. Araştırmacılar, “Bu, modeli genellikle yanlış akıl yürütme adımlarını düzelterek cevabını iki kez ele almaya yönlendirebilir” dedi. Sonuç olarak, AI modeli iyi küratörlü ve doğru cevaplar üretti.
Yapabilirsiniz GitHub’daki S1 modeline göz atın.

