Deepseek’in R1 modellerini eğitme maliyetleri hakkındaki tartışmalar pazarları salladı, ancak gerçek rakamlar gerçekten sürpriz olduğu için üçü etrafında çok fazla dekas gibi görünüyor.
Deepseek’in eğitim maliyetlerinin bildirilen “5 milyon dolar” rakamından önemli ölçüde daha yüksek olduğu söyleniyor; Üst düzey donanıma erişimleri var
Araştırma firması Semianalysis bir Kapsamlı analiz Deepseek’in eğitim maliyetleri açısından gerçekte arkasında olan, R1’in o kadar verimli olduğu anlatısını reddetmek, Nvidia ve diğerlerinden gelen hesaplama kaynaklarının gereksiz olduğu. Deepseek tarafından kullanılan gerçek donanıma dalmadan önce, endüstrinin başlangıçta neyi deldiğine bir göz atalım. Deeepseek’in Openi GPT’nin O1’iyle devam eden R1 modeli için sadece “5 milyon dolar” kullandığı iddia edildi ve bu, ABD borsasına yansıtılan bir perakende paniğini tetikledi; Ancak, toz yerleştiğine göre, gerçek rakamlara bir göz atalım.
Farkında olmayanlar için, Deepseek’in Çin Hedge Fonu Yüksek Flyer’in bir yan projesi olduğu söyleniyordu ve SEMIANALSYS tarafından yapılan rapor, ihracat kısıtlamalarının bu kadar agresif olmadığı 2021’de 10.000 adet Nvidia’nın A100’ü satın aldıklarını iddia ediyor. Deepseek daha sonra ayrı bir varlık satışına dönüştü, ana şirket olan High-Flyer projeyi döndürmeye karar verdi ve işte o zaman işler başladı. Bununla birlikte, daha sonra tartışacağımız bilgi işlem kaynakları biriktirmeye başladılar.
Raporda, Deepseek’in NVIDIA’nın “Çin’e özgü” H800 AI GPU’larının yaklaşık 10.000’ine ve üst düzey H100 AI yongalarının 10.000’ine sahip olduğu belirtiliyor. Dahası, firma Nvidia’nın H20 AI hızlandırıcılarına yatırım yapmıştır ve “ticaret, çıkarım, eğitim ve araştırma” için paylaşılan bip ve yüksek uçurgan kaynakların bir “havuzuna” sahiptir. Bu, Deepseek için Capex’te yaklaşık 1,6 milyar dolara dönüşüyor ve işletme maliyetlerinin 944 milyon dolar civarında olduğu söylendi. Rakamlar, başlangıçta delinmiş piyasalardan daha yüksek fırın açlığına dönüşüyor.

Açıklama için, ilk rakamın nihai modeli yürütme ile ilişkili eğitim maliyetlerinin “özel bir parçası” olduğu söylenir. Deepseek’in aslında iyi olduğu tek şey, en iyi yerel üniversitelerdeki işe alım etkinlikleri aracılığıyla yerel yeteneklerde sermaye idi ve belirli istihdam için 1,3 milyon doların üzerinde çalışan. Deepseek’in R1 modelinin arkasındaki beyinler gerçekten de Openai gibi eşyalarla etkili bir çözüm bulabiliyordu, ancak “yanlış” finans figürleri geçen haftanın Black Swan etkinliğinde bir katalizör görevi gördü.
Semianaliz, Deeepseek’in AI modeli ile iletken kapsamlı testlere sahiptir, bu nedenle bunu kesinlikle kontrol etmelisiniz, o zamandan beri ilginç detaylar vardır.


