Üretken AI’nın hızlı bir şekilde ortaya çıkmasıyla birlikte, teknolojinin daha yüksek yükseklikleri ölçeklendirmek için geniş kaynaklar gerektirdiği daha belirgin hale geliyor. Örneğin, Openai’nin ChatGPT çalıştırmak için günde 700.000 dolara kadar harcadığı bildiriliyor. Bu, sorgu başına soğutma için gereken fahiş su miktarının üstünde, GPT-4 daha önce düşünülenden dört kat daha fazla su tüketiyor-sadece 100 kelime üretmek için üç su şişeleri.
Sofistike AI ilerlemelerini teşvik etmek için gereken saçma nakit wads, Openai’nin geçen yıldan itibaren iflas raporlarına bir yıl içinde 5 milyar dolarlık bir kayıp yapma tahminlerine büyük katkıda bulunmuş olabilir. Bununla birlikte, yeni bir Çinli AI girişimi olan Deepseek, bu oranları, Openai’nin Eşit bir oyun alanında Openai’nin O1 akıl yürütme modeli ile rekabet edebilen ve openai, antropik ve en iyi AI laboratuvarlarını veren yeni bir amiral gemisi modeli ile yeniden tanımlıyor. Google paraları için bir koşu.
Bildiğiniz gibi, AI ilerlemesinin kanunları ölçeklendirmesiyle bodur olduğu ve en iyi AI laboratuvarlarının eğitim için yüksek kaliteli içerik eksikliği nedeniyle gelişmiş modeller geliştirmesini zorlaştıran çok sayıda rapor çevrimiçi olarak ortaya çıktı. Eski Google CEO’su Eric Schmidt ve Openai CEO’su Sam Altman iddiaları reddetti, bu da AI modellerinin eşi görülmemiş yükseklikleri ölçeklendirmesi beklendiğinden hiçbir işaret ölçekleme yasasının başlamadığını gösterdi. “Duvar yok,” diye ekledi Altman.
Deepseek-R1’i rakip AI modellerine kıyasla özel yapan nedir?

Tahmin edebileceğiniz gibi, R1’in önceki karşılaştırması, matematik, kodlama ve akıl yürütme konusunda Openai O1 ile benzer yetenekleri paylaştığını vurgular. Buna göre araştırma makalesi Geçen hafta AI firması tarafından yayınlanan modelin şaşırtıcı akıl yürütme yetenekleri, saf takviye öğrenimi olarak adlandırılan sofistike bir tekniğe dayanıyor. NVIDIA’nın kıdemli araştırma müdürü Jim Fan, tekniğin Google DeepMind’in Alphazero ile olan yaklaşımına benzer olduğunu iddia ediyor, bu da GO ve satranç dahil olmak üzere çok çeşitli oyunlarda sergileyen “önce insan büyük ustası hareketlerini taklit etmeden” ( İş İçeriden).
R1 tam olarak ne yapar? Deepseek, “matematik, kod ve akıl yürütme görevlerinde Openai O1 ile karşılaştırılabilir performans” sağladığını söylüyor.
İlginç bir şekilde, R1, AIME 2024 Matematik ölçütünde% 79,8 puan aldı ve Openai’nin O1 akıl yürütme modelini yendi. Ayrıca, kodlama testlerinde kodlama testlerinde uzman seviyesi gösterdi ve kod donanımları üzerinde 2.029 ELO derecesi ve insan rakiplerinin% 96,3’ünü daha iyi performans gösterdi.
Takviye öğrenimi güçlü ve ilginç akıl yürütme davranışlarını teşvik ederek modelin önceden eğitim veya programlama olmadan kendi kendini doğrulama ve yansıma gibi gelişmiş yetenekler geliştirmesine izin verir.
ABD olmayan bir şirketin Openai’nin orijinal misyonunu canlı tuttuğu bir zaman çizelgesinde yaşıyoruz – herkesi güçlendiren gerçekten açık, sınır araştırmaları. Mantıklı değil. En eğlenceli sonuç en olasıdır.20 Ocak 2025
ABD olmayan bir şirketin Openai’nin orijinal misyonunu canlı tuttuğu bir zaman çizelgesinde yaşıyoruz – herkesi güçlendiren gerçekten açık, sınır araştırmaları. Mantıklı değil. En eğlenceli sonuç en olasıdır. Deepseek-R1 sadece bir model barajını açık kaynaklamakla kalmaz, aynı zamanda tüm eğitim sırlarını da döker. Belki de bir RL volanının büyük ve sürekli büyümesini gösteren ilk OSS projesidir. Etki “dahili olarak elde edilen ASI” veya “Project Strawberry” gibi efsanevi isimler ile yapılabilir. Etki, sadece ham algoritmaların ve matplotlib öğrenme eğrilerinin boşaltılmasıyla da yapılabilir.
Nvidia Sr. Araştırma Müdürü, Jim Fan
Bağlam için, Deepseek-R1, gelişiminin arkasındaki AI araştırmacıları için bir “AHA anı” başlatan R1-Zero adlı modelin önceki bir versiyonuna dayanmaktadır. Araştırmacılar, yapay zekanın “ilk yaklaşımını yeniden değerlendirerek bir soruna daha fazla düşünme süresi tahsis etmeyi öğrendiğini” açıkladılar. Wharton Prof. Ethan Mollick, R1’in yanıtlarının “insan düşüncesine yüksek sesle” benzediğini söyledi.
R1’in lansmanı, Openai ve Antropic’in açgözlü AGI ölçütünü kovalayan bir kolun yarışında olduğu gibi geliyor. Openai CEO’su Sam Altman, ekibinin AGI’yi nasıl inşa edeceğini bildiğini ve mevcut donanımla beklenenden daha erken elde edileceğini belirtti. Yönetici, kıyaslamanın% 99,9’luk bir olasılık olan AI’nın insanlığı sona erdireceğine rağmen şaşırtıcı derecede az toplumsal bir etki ile Whoosh olacağını da sözlerine ekledi.
Bu amaçla, Deepseek’in açık kaynaklı modeli, AI manzarasındaki adil rekabeti potansiyel olarak geri kazandırıyor. Openai, O1 akıl yürütme modelini geniş mevcudiyete gönderdi, ancak Aralık ayında yeni 200 $ Chatgpt Pro planına gömüldü. Sam Altman, modelin fahiş fiyatlandırmasının arkasındaki mantığı “en zor problemler için daha zor düşünebileceğini” belirterek açıkladı.
Deli Chen’e göreDeepseek’te DL araştırmacısı:
“İnanılmaz sonuçlar, bir rüya gibi geliyor – R1 modelimiz şimdi dünyada 1 numaralı (stil kontrolü ile)! 🌍🏆 Şu anda kelimelerin ötesinde. 🤯 Tek bildiğim, açık kaynaklı AGI’yi herkes için bir gerçeklik haline getirmek için ileriye doğru itmeye devam ediyoruz. 🚀 “
Deepseek’in yeni R1’in eğlenceli demoları, CCP’nin hoşlanmadığı konular hakkında sorulduğunda kendini kapatıyor ⬇️ ama sansür, modelin kendisi değil, üstteki bir katman tarafından açıkça yapılıyor. Açık kaynak sürümü olan ve ne kadar sansür olup olmadığını test edebiliyor var mı? https://t.co/gy0pid9qw020 Ocak 2025
R1 amiral gemisi AI modelinin açık kaynaklarının yanı sıra, Deepseek modeli çalıştırmak için bankayı kırıyor. Şirketin araştırma makalesine göre, model sorguları milyon jeton başına sadece 0,14 $ olarak çalıştırıyor ve Openai’nin dik 7.50 $ ‘ın millerinin arkasında. Deepseek, maliyetin yaklaşık% 3-5’i ile O1 akıl yürütme modeli ile Openai’nin fahiş çabalarını aştı.
Deepseek’in yeni R1’in eğlenceli demoları, CCP’nin hoşlanmadığı konular hakkında sorulduğunda kendini kapatıyor ⬇️ ama sansür, modelin kendisi değil, üstteki bir katman tarafından açıkça yapılıyor. Açık kaynak sürümü olan ve ne kadar sansür olup olmadığını test edebiliyor var mı? https://t.co/gy0pid9qw020 Ocak 2025
R1, CCP’nin sevmediği konular hakkında soru sorulduğunda kendisini kapatma ve modeli lobotomize edebilecek ve kullanıcı deneyimini mahvedebilecek sansür göstermek de dahil olmak üzere zorluklardan payıyla karşı karşıya. Eski Openai Yönetim Kurulu Üyesi Helen Toner’e göre:
“Ancak sansür, modelin kendisi değil, üstteki bir katman tarafından açıkça yapılıyor. Açık kaynak sürümü olan ve ne kadar sansür olup olmadığını test edebiliyor mu? ”

