Deepseek, piyasaları tizzy’ye gönderen R1 “akıl yürütme” AI modelini yayınlamasından bir hafta sonra, Hugging Face’teki araştırmacılar, modeli “açık bilgi” arayışında adlandırdıkları şeyde sıfırdan kopyalamaya çalışıyorlar.
Sarılma Yüz Başkanı Leandro von Werra ve birkaç şirket mühendisi Open-R1’i başlattıeğitmek için kullanılan veriler de dahil olmak üzere tüm bileşenlerini R1 ve açık kaynak oluşturmayı amaçlayan bir proje.
Mühendisler, Deepseek’in “Black Box” sürüm felsefesi tarafından hareket etmeye zorlandıklarını söyledi. Teknik olarak, R1, modelin izin verilen lisanslı olması nedeniyle “açıktır”, yani büyük ölçüde kısıtlamalar olmadan dağıtılabilir. Ancak, R1 “açık kaynak” değildir, çünkü onu oluşturmak için kullanılan araçların çoğu gizemle örtülür. Birçok yüksek uçan AI şirketi gibi, Deepseek de gizli sosunu ortaya çıkarmaktan nefret ediyor.
Open-R1 projesindeki sarılma yüz mühendislerinden Elie Bakouch, “R1 modeli etkileyici, ancak açık veri seti, deney detayları veya ara modellerin mevcut olmadığını, bu da çoğaltmayı ve daha fazla araştırmayı zorlaştırıyor” dedi. “Tamamen açık kaynaklı R1’in tam mimarisi sadece şeffaflık ile ilgili değil, potansiyelinin kilidini açmakla ilgili.”
O kadar açık değil
Kısmen nicel bir riskten korunma fonu tarafından finanse edilen Çinli bir AI laboratuvarı olan Deepseek, geçen hafta R1’i piyasaya sürdü. Bir dizi kriterde, R1 Openai’nin O1 akıl yürütme modelinin performansını eşleştirir – ve hatta aşar.
Bir akıl yürütme modeli olan R1, normalde modelleri gezen bazı tuzaklardan kaçınmasına yardımcı olan etkili bir şekilde gerçekleştirir. Akıl yürütme modelleri, tipik bir mantıksız modele kıyasla çözümlere ulaşmak için biraz daha uzun sürer-genellikle saniye ila dakika daha uzun sürer. Yukarı tarafı, fizik, bilim ve matematik gibi alanlarda daha güvenilir olma eğiliminde olmalarıdır.
R1, R1’e ücretsiz erişim sağlayan Deepseek’in chatbot uygulamasından sonra ana akım bilincine girdi. Apple App Store listelerinin tepesine yükseldi. R1’in geliştirildiği hız ve verimlilik – Deepseek, Openai O1’i serbest bıraktıktan sadece haftalar sonra modeli yayınladı – birçok Wall Street analisti ve teknoloji uzmanının ABD’nin AI yarışında liderliğini koruyup koruyamayacağını sorgulamasına yol açtı.
Bakouch, TechCrunch’a verdiği demeçte, Open-R1 projesi “model eğitiminin kara kutusunu tamamen açmak” dan daha az endişe duyuyor. R1’in eğitim kodu veya eğitim talimatlarıyla yayınlanmadığı için, modeli derinlemesine incelemenin zor olduğunu – davranışını çok daha az yönlendirdiğini kaydetti.
Bakouch, “Veri seti ve işlemi üzerinde kontrol sahibi olmak, bir modeli hassas alanlarda sorumlu bir şekilde dağıtmak için kritik öneme” dedi. “Aynı zamanda modeldeki önyargıları anlamaya ve ele almaya yardımcı olur. Araştırmacılar parçalardan daha fazlasını gerektirir […] Mümkün olanın sınırlarını zorlamak için. ”
Çoğaltma Adımları
Open-R1 projesinin amacı, kısmen 768 NVIDIA H100 GPU ile özel bir araştırma sunucusu olan Hugging Face’in Science Cluster’a dayanarak birkaç hafta içinde R1’i çoğaltmaktır.
Sarılma yüz mühendisleri, R1 oluşturmak için kullanılan Deepseek’e benzer veri setleri oluşturmak için bilim kümesine dokunmayı planlıyor. Bir eğitim boru hattı oluşturmak için ekip, AI ve daha geniş teknoloji topluluklarından Open-R1 projesinin barındırıldığı Hugging Face ve Github’da yardım talep ediyor.
“Algoritmaları ve tarifleri uyguladığımızdan emin olmalıyız. [correctly,]“Von Werra, TechCrunch’a şunları söyledi:“ Ama bu bir topluluk çabasının mücadelede mükemmel olduğu, sorunun mümkün olduğunca çok göz attığınız bir şey. ”
Zaten çok ilgi var. Open-R1 projesi GitHub’da sadece üç gün içinde 10.000 yıldız topladı. Yıldızlar, GitHub kullanıcılarının bir projeyi sevdiğini veya yararlı bulduklarını göstermelerinin bir yoludur.
Open-R1 projesi başarılı olursa, AI araştırmacıları eğitim boru hattının üstesinden gelebilecek ve yeni nesil açık kaynak muhakeme modellerini geliştirebileceklerini söyledi. Open-R1 projesinin sadece R1’in güçlü bir açık kaynak kopyasını değil, daha iyi modellerin temelini oluşturacağını umuyor.
Bakouch, “Sıfır toplamlı bir oyun olmaktan ziyade, açık kaynak geliştirme, sınır laboratuvarları ve model sağlayıcılar da dahil olmak üzere herkese aynı yenilikleri kullanabileceğinden hemen yararlanıyor” dedi.
Bazı AI uzmanları açık kaynaklı AI istismarı potansiyeli hakkında endişeler yaratırken, Bakouch faydaların risklerden daha ağır bastığına inanmaktadır.
“R1 tarifi çoğaltıldığında, bazı GPU’lar kiralayabilen herkes kendi R1 varyantlarını kendi verileriyle inşa edebilir ve teknolojiyi her yerde daha da yayabilir” dedi. “Yapay zekada açıklığın rolünü güçlendiren son açık kaynak sürümleri için gerçekten heyecanlıyız. Sadece bir avuç laboratuvarın ilerleme kaydedebileceği ve açık kaynağın geride kaldığı anlatıyı değiştiren alan için önemli bir değişim. ”

