
Çinli girişim Deepseek kısa bir süre önce, Open AI’nın O1’iyle rekabet ettiğine inanılan bir model olan R1 adlı gelişmiş AI modeli için şaşırtıcı derecede düşük hesaplama kaynakları kullanımı ile teknoloji dünyasında merkez sahne aldı. Fakat, Yarı tür Deepseek’in bir sonraki modelini geliştirmesi için Deepseek’in 1,6 milyar dolarlık donanım maliyetleri ve 50.000 hopper GPU’sunun aldığını bildiriyor, bu da Deepseek’in AI eğitimi ve çıkarımını yeniden keşfettiği fikrini zayıflatıyor.
Raporda, Deepseek yaklaşık 50.000 Hopper GPU ile kapsamlı bir bilgi işlem altyapısı işletiyor. Semianaliz’e göre, 10.000 H800’ler ve 10.000 H100’ler dahil. Bu kaynaklar birden fazla lokasyonda dağıtılır ve AI eğitimi, araştırma ve finansal modelleme gibi hizmet amaçlıdır. SEMIANSYS’e göre, şirketin sunuculara toplam sermaye yatırımı 1.6 milyar dolar civarındadır.
Deepseek, ABD tabanlı modellerine kıyasla çok daha düşük olan Deepseek-V3 Experts (MOE) modelinin küçük donanım gereksinimlerini açıkladığında AI dünyasının dikkatini çekti. Sonra Deepseek, açık AI-rekabetçi bir R1 AI modeliyle yüksek teknoloji dünyasını salladı. Ancak sonra saygın pazar istihbarat şirketi Semianalysis, Deepseek’in R1 için 1.6 milyar dolarlık bir donanım kullandığını gösteren bulgularını açıkladı.
Deepseek, AI’yı erken kabul eden ve GPU’lara yoğun bir şekilde yatırım yapan bir Çin hedge fonu olan High-Flyer’den kaynaklanmaktadır. 2023’te High-Flyer, Deepseek’i sadece AI’ya odaklanan ayrı bir girişim olarak başlattı. Birçok yarışmacının aksine, Deepseek kendi kendini finanse ediyor, bu da karar vermede esneklik ve hız kazandırıyor. Semianaliz’e göre, küçük bir dalı olduğu iddialarına rağmen, şirket teknolojisine 500 milyon doların üzerinde yatırım yaptı.
Deepseek için önemli bir farklılaştırıcı, harici bulut sağlayıcılarına dayanan diğer AI girişimlerinin aksine, kendi veri merkezlerini çalıştırma yeteneğidir. Bu bağımsızlık, deneyler ve AI modeli optimizasyonları üzerinde tam kontrol sağlar. Buna ek olarak, harici darboğazlar olmadan hızlı yinelemeyi sağlar, bu da Deepseek’i sektördeki geleneksel oyunculara kıyasla yüksek verimli hale getirir.
Sonra bir Çinli şirketten beklemeyeceği bir şey var: Tayvan’dan kaçak avcılık veya ABD Deepseek’ten kaçak avcılık yapmadan, sadece Çin içinden, resmi kimlik bilgilerinden ziyade becerilere ve problem çözme yeteneklerine odaklanarak, yetenek edinimi var. Yarı. İşe alım çabaları Peking Üniversitesi ve Zhejiang Üniversitesi gibi kurumları hedef alıyor ve son derece rekabetçi maaşlar sunuyor. Araştırmaya göre, Deepseek’teki bazı AI araştırmacıları 1,3 milyon doların üzerinde para kazanıyor ve MoonShot gibi diğer önde gelen Çinli AI firmalarında tazminatı aşıyor.
Yetenek girişi nedeniyle Deepseek, aylarca gelişme ve önemli GPU kullanımı gerektiren çok başlı gizli dikkat (MLA) gibi yeniliklere öncülük etti. Deepseek, AI model gelişimi etrafında beklentileri yeniden şekillendirerek, kaba kuvvet ölçeklendirme üzerindeki verimlilik ve algoritmik gelişmeleri vurgulamaktadır. Bu yaklaşım, birçok nedenden dolayı, bazılarının hızlı gelişmelerin üst düzey GPU’lara olan talebi azaltabileceğine ve NVIDIA gibi şirketleri etkileyebileceğine inanmasına neden oldu.
Deepseek’in en son modelini sadece 6 milyon dolarlık eğittiği iddiası, yutturmacanın çoğunu körükledi. Bununla birlikte, bu rakam toplam eğitim maliyetinin sadece bir kısmını-özellikle eğitim öncesi için gereken GPU süresini ifade eder. Araştırma, model arıtma, veri işleme veya genel altyapı giderlerini hesaba katmaz. Gerçekte, Deepseek kuruluşundan bu yana AI gelişimine 500 milyon doların üzerinde para harcadı. Bürokrasi ile yüklenen daha büyük firmaların aksine, Deepseek’in yalın yapısı AI inovasyonunda agresif bir şekilde ilerlemesini sağlıyor, Semianalysis.
Deepseek’in yükselişi, iyi finanse edilen, bağımsız bir AI şirketinin endüstri liderlerine nasıl meydan okuyabileceğini vurguluyor. Ancak, kamu söylemi hype tarafından yönlendirildi. Gerçeklik daha karmaşıktır: Deepseek’in başarısı milyarlarca dolar, teknik atılımlar ve rekabetçi bir işgücünün stratejik yatırımları üzerine inşa edilmiştir. Bunun anlamı, harikalar olmamasıdır. Elon Musk’un bir yıl kadar önce belirttiği gibi, AI’da rekabetçi olmak istiyorsanız, yılda milyarlar harcayın, görünüşe göre harcanan şey bu.

