Deepseek’in yeni açık kaynaklı AI akıl yürütme modeli R1, Nvidia’nın hisselerinin satışını tetikledi ve tüketici uygulamasının uygulama mağazalarının en üstüne yükselmesine neden oldu.
Geçen ay Deepseek, NVIDIA’nın H800 GPU’larının yaklaşık iki ay içinde yaklaşık iki ayda yaklaşık 5,5 milyon dolarlık bir veri merkezini kullanarak bir model eğittiğini söyledi. Geçen hafta, en son modelinin performansının dünyanın en gelişmiş akıl yürütme modelleriyle eşleştiğini gösteren bir makale yayınladı. Bu modeller, Nvidia’nın daha hızlı, çok pahalı AI cipsleri için milyarlarca harcama yapan veri merkezlerinde eğitiliyor.
Teknoloji endüstrisindeki Deepseek’in yüksek performanslı, düşük maliyetli modeline tepki vahşi olmuştur. Örneğin Pat Gelsinger Glee ile X’e aldı, gönderdi“Teşekkürler Deepseek ekibi.”
Gelsinger, elbette, bir donanım mühendisi olan Intel’in yeni CEO’su ve kiliseler için bir mesajlaşma ve katılım platformu olan kendi halka arzı olan Gloo’nun şu anki başkanı. Dört yıl sonra Aralık ayında Intel’den ayrıldı ve Nvidia’yı Intel’in alternatif AI GPU’ları Gaudi 3 AI ile kovalamaya çalıştı.
Gelsinger, Deepseek’in teknoloji endüstrisine en önemli üç dersini hatırlatması gerektiğini yazdı: düşük maliyetler daha geniş bir evlat edinme anlamına gelir; yaratıcılık kısıtlamalar altında gelişir; ve “Açık kazanır. Deepseek, temel AI model çalışmasının giderek daha kapalı dünyasının sıfırlanmasına yardımcı olacak ”diye yazdı. Openai ve Antropik kapalı kaynaktır.
Gelsinger, TechCrunch’a R1’in çok etkileyici olduğunu söyledi, Gloo zaten Openai’yi benimsemeye ve ödememeye karar verdi. Gloo, sohbet botu ve diğer hizmetler sunacak Kallm adlı bir AI hizmeti inşa ediyor.
“Tutkal mühendislerim bugün R1 çalışıyor” dedi. “O1’i çalıştırabilirlerdi – API’lerden sadece O1’e erişebilirler.”
Bunun yerine, iki hafta içinde Gloo, Kallm’i “hepsi açık kaynak olan kendi temel modelimizle” sıfırdan yeniden inşa etmeyi bekliyor. “Bu heyecan verici.”
Deepseek’in AI’yi bu kadar uygun hale getireceğini düşündüğünü, AI’nın sadece her yerde olmayacağını söyledi. İyi AI her yerde olacak. “Oura halkamda daha iyi AI istiyorum. İşitme cihazımda daha iyi AI istiyorum. Telefonumda daha fazla AI istiyorum. Gömülü cihazlarımda EV’ümdeki ses tanıması gibi daha iyi AI istiyorum ”diyor.
Gelsinger’in mutlu tepkisi belki de akıl yürütme temel modellerinin artık daha yüksek performanslı ve çok daha uygun fiyatlı bir meydan okuyandan daha az heyecanlı olan diğerleriyle çelişiyordu. AI daha az değil, daha pahalı büyüyor.
Deepseek’i ima ederek tepki gösteren diğerleri sayılarını bir şekilde karıştırmış olmalı ve eğitim daha maliyetli olmalı. Bazıları, Çin’e AI yonga ihracat kısıtlamaları nedeniyle üst düzey çipler kullandığını söyleyemediğini düşündü. Diğerleri performansında delikler açıyorlardı, diğer modellerin daha iyi yaptığı noktalar buluyordu. Yine de diğerleri, Openai’nin bir sonraki modelinin O3’ün, statükonun onarılacağı serbest bırakıldığında R1’den fazla olacağına inanıyor.
Gelsinger tüm bunları omuz silkiyor. “İşin çoğu Çin’de yapıldığı göz önüne alındığında, asla tam şeffaflığa sahip olmayacaksınız” dedi. “Ama yine de, tüm kanıtlar eğitimlerinde O1’den daha ucuz olması.”
Deepseek, yapay zekanın “yaratıcılığı mühendislik yaparak, daha fazla donanım gücü atmaması ve sorundaki kaynakları hesaplayamadığını kanıtlıyor. Yani bu heyecan verici ”dedi.
Bunun için, gizlilik ve sansür konusundaki endişeler gibi her şey olan Çinli bir geliştirici olmak için, Gelsinger mecazi olarak başını sallıyor.
“Çinlilerin bize açık ekosistemlerin gücünü hatırlatması, belki de batı dünyası için topluluğumuz için utanç verici bir dokunuş” dedi.
TechCrunch AI odaklı bir bülten var! Her Çarşamba günü gelen kutunuza almak için buraya kaydolun.

