Çin AI laboratuvar Deepseek, sözde akıl yürütme modeli olan Deepseek-R1’in açık bir versiyonunu yayınladı.
R1, bir MIT lisansı altında AI Dev Platform Hugging Yüzünden edinilebilir, yani kısıtlama olmadan ticari olarak kullanılabilir. Deepseek’e göre R1, AIME, MATH-500 ve SWE-Bench ölçümlerinde O1’i yener. AIME, bir modelin performansını değerlendirmek için başka modeller kullanırken, Math-500 kelime problemlerinin bir koleksiyonudur. Bu arada SWE-Bench doğrulandı, programlama görevlerine odaklanıyor.
Bir akıl yürütme modeli olan R1, normalde modelleri gezen bazı tuzaklardan kaçınmasına yardımcı olan etkili bir şekilde gerçekleştirir. Akıl yürütme modelleri, tipik bir mantıksız modele kıyasla çözümlere ulaşmak için biraz daha uzun sürer – genellikle saniye ila dakika daha uzun sürer. Yukarı tarafı, fizik, bilim ve matematik gibi alanlarda daha güvenilir olma eğiliminde olmalarıdır.
R1 671 milyar parametre içerir, Deepseek bir teknik rapor. Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir ve daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.
Gerçekten de, 671 milyar parametre çok büyük, ancak Deepseek, 1.5 milyar parametreden 70 milyar parametreye kadar R1’in “damıtılmış” versiyonlarını da yayınladı. En küçüğü bir dizüstü bilgisayarda çalışabilir. Tam R1’e gelince, daha önce donanım gerektirir, ancak ki Deepseek’in API’sı aracılığıyla Openai’nin O1’den% 90-% 95 daha ucuz.
Hugging Face’in CEO’su Clem Delangue, X’e Gönderin Pazartesi günü, platformdaki geliştiricilerin 2,5 milyon indirme oluşturan 500’den fazla “türev” R1 modeli oluşturdukları – resmi R1’in aldığı indirme sayısının beş katı.
R1’in bir dezavantajı var. Çinli bir model olmak, kıyaslama Çin’in internet düzenleyicisi tarafından “temel sosyalist değerleri somutlaştırmasını” sağlamak için. R1, örneğin Tiananmen Meydanı veya Tayvan’ın özerkliği hakkında soruları cevaplamayacak.

Birçok Diğer akıl yürütme modelleri de dahil olmak üzere Çin yapay zeka sistemleri, ülkedeki düzenleyicilerin öfkesini artırabilecek konulara yanıt vermeyi reddetti, örneğin Xi Jinping rejim.
R1, giden Biden yönetiminden günler sonra gelir. daha sert Çin girişimleri için AI teknolojilerine ihracat kuralları ve kısıtlamaları. Çin’deki şirketlerin zaten gelişmiş AI yongaları satın alması engellendi, ancak yeni kurallar yazıldığı gibi yürürlüğe girerse, şirketler hem yarı iletken teknoloji hem de sofistike AI sistemleri için gereken modellerde daha katı kapaklarla karşılaşacak.
Geçen hafta bir politika belgesinde Openai, ABD hükümetini ABD’nin gelişimini desteklemeye çağırdı, Çin modelleri eşleşmeyecek veya bunları aşmayacaktı. Bir röportaj Bilgi ile Openai’nin Başkan Yardımcısı Chris Lehane, Deepseek’in kurumsal ebeveyni High Flyer Capital Management’ı özel bir endişe organizasyonu olarak seçti.
Şimdiye kadar, en az üç Çinli laboratuvar – Deepseek, Alibaba ve KimiÇin Unicorn MoonShot AI’sına ait olan – Rakip O1 iddia ettikleri modeller üretti. (Dikkat çekici bir şekilde, Deepseek ilk idi – Kasım ayı sonlarında R1’in önizlemesini duyurdu.) Bir postalamak X’te George Mason Üniversitesi’nden bir AI araştırmacısı olan Dean Ball, trendin Çin AI laboratuvarlarının “hızlı takipçiler” olmaya devam edeceğini öne sürdüğünü söyledi.
“Deepseek’in damıtılmış modellerinin etkileyici performansı […] Çok yetenekli akılcıların geniş bir şekilde çoğalmaya devam edeceği ve yerel donanım üzerinde çalıştırılabilmeleri anlamına geliyor, ”diye yazdı Ball,“ yukarıdan aşağıya herhangi bir kontrol rejiminin gözünden çok uzak ”.
Bu hikaye başlangıçta 20 Ocak’ta yayınlandı ve 27 Ocak’ta daha fazla bilgi ile güncellendi.
TechCrunch AI odaklı bir bülten var! BURADA KAYDET Her Çarşamba günü gelen kutunuza almak için.

