DeepSeek, akıl yürütme modelinin belirli kriterlerde OpenAI'nin o1'ini geride bıraktığını iddia ediyor - Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film

Çin yapay zeka laboratuvarı DeepSeek, belirli yapay zeka kriterlerinde OpenAI’nin o1’i kadar iyi performans gösterdiğini iddia ettiği, akıl yürütme modeli olarak adlandırılan DeepSeek-R1’in açık bir sürümünü yayınladı.

R1, MIT lisansı kapsamında AI geliştirme platformu Hugging Face’ten temin edilebilir, bu da ticari olarak kısıtlama olmaksızın kullanılabileceği anlamına gelir. DeepSeek’e göre R1, AIME, MATH-500 ve SWE-bench Verified kriterlerinde o1’i geçiyor. AIME, bir modelin performansını değerlendirmek için başka modeller kullanır; MATH-500 ise sözlü problemlerden oluşan bir koleksiyondur. SWE-bench Verified ise programlama görevlerine odaklanıyor.

Bir akıl yürütme modeli olan R1, kendisini etkili bir şekilde kontrol eder ve bu da normalde modelleri tuzağa düşüren bazı tuzaklardan kaçınmasına yardımcı olur. Akıl yürütme modellerinin çözümlere ulaşması, tipik akıl yürütme olmayan modele kıyasla biraz daha uzun sürer (genellikle saniyelerden dakikalara kadar). Olumlu tarafı ise fizik, bilim ve matematik gibi alanlarda daha güvenilir olma eğiliminde olmalarıdır.

DeepSeek, R1’in 671 milyar parametre içerdiğini ortaya çıkardı teknik rapor. Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir ve daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.

671 milyar parametre çok büyük bir sayıdır, ancak DeepSeek ayrıca R1’in boyutları 1,5 milyar parametreden 70 milyar parametreye kadar değişen “damıtılmış” versiyonlarını da yayınladı. En küçüğü bir dizüstü bilgisayarda çalışabilir. Tam R1’e gelince, daha güçlü bir donanım gerektirir, ancak öyle DeepSeek’in API’si aracılığıyla OpenAI’nin o1’inden %90-%95 daha ucuz fiyatlarla mevcuttur.

R1’in bir dezavantajı var. Çinli bir model olmak tabidir kıyaslama Yanıtlarının “temel sosyalist değerleri içermesini” sağlamak için Çin’in internet düzenleyicisi tarafından. R1, örneğin Tiananmen Meydanı veya Tayvan’ın özerkliği hakkındaki soruları yanıtlamayacak.

DeepSeek R1 reddi — R1’in filtrelemesi iş başında. **Resim Kredisi:**Derin Arama

Birçok Diğer akıl yürütme modelleri de dahil olmak üzere Çin yapay zeka sistemleri, ülkedeki düzenleyicilerin öfkesini artırabilecek spekülasyonlar gibi konulara yanıt vermeyi reddediyor. Xi Jinping Rejim.

R1, görevden ayrılan Biden yönetiminin teklifinden günler sonra geliyor daha sert Çin girişimleri için yapay zeka teknolojilerine ilişkin ihracat kuralları ve kısıtlamalar. Çin’deki şirketlerin gelişmiş yapay zeka çiplerini satın alması zaten engellenmişti, ancak yeni kurallar yazıldığı gibi yürürlüğe girerse şirketler hem yarı iletken teknolojisi hem de gelişmiş yapay zeka sistemlerini başlatmak için gereken modeller konusunda daha katı sınırlamalarla karşı karşıya kalacak.

Geçen hafta bir politika belgesinde OpenAI, Çin modellerinin yetenek açısından onlarla eşleşmesi veya onları aşmaması için ABD hükümetini ABD yapay zekasının gelişimini desteklemeye çağırdı. bir röportaj OpenAI’nin politikadan sorumlu başkan yardımcısı Chris Lehane, The Information ile DeepSeek’in kurumsal ana şirketi olan High Flyer Capital Management’ı özellikle endişe duyulan bir kuruluş olarak seçti.

Şu ana kadar en az üç Çin laboratuvarı – DeepSeek, Alibaba ve KimiÇinli unicorn Moonshot AI’nin sahibi olduğu O1’e rakip olduğunu iddia ettiği modeller üretti. (Dikkate değer ki ilki DeepSeek’ti; Kasım ayının sonlarında R1’in ön izlemesini duyurdu.) postalamak George Mason Üniversitesi’nden yapay zeka araştırmacısı Dean Ball, X’te, trendin Çin yapay zeka laboratuvarlarının “hızlı takipçiler” olmaya devam edeceğini öne sürdüğünü söyledi.

“DeepSeek’in damıtılmış modellerinin etkileyici performansı […] Bu, çok yetenekli akıl yürütücülerin geniş çapta çoğalmaya devam edeceği ve yerel donanım üzerinde çalıştırılabilir olacağı anlamına geliyor,” diye yazdı Ball, “herhangi bir yukarıdan aşağıya kontrol rejiminin gözünden uzakta.”

genel-24

DeepSeek, akıl yürütme modelinin belirli kriterlerde OpenAI’nin o1’ini geride bıraktığını iddia ediyor

Sanal Medya

Son Eklenenler

Yeni Sezon Güncellemesi Sonrası Heyecan Verici PvE Modu

Performans İyileştirme Günü: N+1 Sorgularını Avlamak ve Laravel’deki Gereksiz Sorguları Ortadan Kaldırmak

Prime Günü İçin En İyi Dyson İndirimleri: Vakumlar ve Saç Aletleri

Roborock Saros 20’de 240 Dolar Tasarruf Fırsatı

Prime Günü’nde en uygun fiyatlı RTX 5080’de 250$ indirim!

Google Home Sizi Daha İyi Tanıyacak

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer