DeepSeek neden bu kadar popüler oldu?
DeepSeek nereden geldi?
DeepSeek’in güçlü modelleri nelerdir?
DeepSeek’in disruptif yaklaşımı nedir?
DeepSeek’in tüccar kökenleri
DeepSeek, High-Flyer Capital Management tarafından desteklenmektedir; bu, ticaret kararlarını bilgilendirmek için AI kullanan bir Çin kuantitatif hedge fonudur. Liang Wenfeng, 2015 yılında High-Flyer’ı kuran AI meraklısı, ticarete Zhejiang Üniversitesi öğrencisiyken başlamıştır. 2019 yılında High-Flyer’ı başta ayırarak, AI algoritmalarını geliştirmek ve yaymak üzerine odaklanan bir hedge fonu olarak piyasaya sürdü.
2023 yılında High-Flyer, finansal işinden ayrı bir AI araçları araştırma laboratuvarı olan DeepSeek’i kurdu. Yatırımcılarından biri olarak High-Flyer ile birlikte laboratuvar, kendi şirketi haline geldi. İlk günden itibaren DeepSeek, model eğitimi için kendi veri merkezi kümelerini inşa etti. Ancak, diğer Çinli AI şirketleri gibi, DeepSeek de ABD ihracat yasaklarından etkilenmiştir. Şirket, en son modellerinden birini eğitmek için ABD şirketlerine sunulan H100 çipinin daha az güçlü bir versiyonu olan Nvidia H800 çiplerini kullanmak zorunda kalmıştır.
DeepSeek’in teknik ekibinin genç olduğu bildirilmektedir. Şirket, en iyi Çin üniversitelerinden doktora araştırmacılarını agresif bir şekilde işe alırken, bilgisayar bilimi geçmişi olmayan insanları da teknolojiye geniş bir yelpazede konuları daha iyi anlamaları için işe alır.
DeepSeek’in güçlü modelleri
DeepSeek, Kasım 2023‘te ilk model seti olan DeepSeek Coder, DeepSeek LLM ve DeepSeek Chat‘i tanıttı. Ancak, startup’ın bir sonraki nesil DeepSeek-V2 model ailesini piyasaya sürdüğünde, AI endüstrisi dikkatini çekmeye başladı.
DeepSeek-V2, genel amaçlı bir metin ve resim analiz sistemi olarak çeşitli AI benchmark testlerinde iyi performans gösterdi — ayrıca o dönemde benzer modellere kıyasla çok daha ucuzdu. Bu durum, DeepSeek’in yerel rakiplerini, örneğin ByteDance ve Alibaba gibi, bazı modellerinin kullanım fiyatlarını düşürmeye ve diğerlerini tamamen ücretsiz hale getirmeye zorladı.
DeepSeek-V3, Aralık 2024‘te piyasaya sürüldü ve DeepSeek’in ününü daha da artırdı. DeepSeek’in iç benchmark testlerine göre, DeepSeek V3, Meta’nın Llama’sı gibi indirilebilir, açık erişimli modelleri ve OpenAI’nin GPT-4o gibi API üzerinden erişilebilen “kapalı” modelleri geride bırakmaktadır.
DeepSeek’in R1 “akıl yürütme” modeli ise Ocak 2024’te piyasaya sürüldü. DeepSeek, R1’in, önemli benchmarklarda OpenAI‘nin o1 modeli kadar iyi performans gösterdiğini iddia etmektedir. R1, bir akıl yürütme modeli olduğundan, kendi kendini doğrular ve bu sayede genellikle sorun yaratan bazı tuzaklardan kaçınmasına yardımcı olur. Akıl yürütme modelleri, tipik bir akıl yürütme olmayan modele kıyasla çözümlere ulaşmak için genelde birkaç saniye veya dakika daha fazla zaman alır. Ancak, bu modeller fizik, bilim ve matematik gibi alanlarda daha güvenilir olma eğilimindedir.
Ancak, R1, DeepSeek V3 ve diğer modellerin bazı dezavantajları bulunmaktadır. Çin yapımı bir AI olduğundan, cevaplarının “temel sosyalist değerleri” yansıtmasını sağlamak için Çin internet düzenleyicisi tarafından benchmark testine tabi tutulmaktadır. Örneğin, DeepSeek’in chatbot uygulamasında R1, Tiananmen Meydanı veya Tayvan‘ın özerkliği hakkında soruları yanıtlamamaktadır.
Mart ayında DeepSeek, 16.5 milyon ziyareti geçti. "Mart için, DeepSeek, trafik kaybına rağmen ikinci sırada, bu özellikle Şubat ayına göre %25’lik bir düşüşle gerçekleşti,” diyor David Carr, Similarweb editörü. Ancak, bu sayılar, ChatGPT‘nin Mart ayında 500 milyon haftalık aktif kullanıcıyı geçmesi ile kıyaslandığında hala oldukça düşük kalmaktadır.
Disruptif bir yaklaşım
DeepSeek’in bir iş modeli varsa, tam olarak ne olduğu açık değildir. Şirket ürün ve hizmetlerini piyasa değerinin çok altında fiyatlandırmaktadır ve birçok ürünü ücretsiz sunmaktadır. Ayrıca, büyük miktarda VC ilgisine rağmen yatırımcı parası almaktan kaçınmaktadır.
DeepSeek, verimlilik atılımları sayesinde aşırı maliyet rekabetçiliğini koruduğunu iddia etmektedir. Ancak, bazı uzmanlar şirketin sağladığı rakamları sorgulamaktadır.
Her durumda, geliştiriciler DeepSeek’in modellerine yönelmiştir. Bunlar, genellikle açık kaynak olarak bilinen terimdeki anlamıyla açık olmasa da, ticari kullanım için izin veren lisanslar altında kullanılabilir. Hugging Face CEO’su Clem Delangue’a göre, DeepSeek’in modellerinin ev sahibi olduğu platform olan Hugging Face üzerinde, geliştiriciler R1’in 500’den fazla “türev” modelini yaratmış ve bu modeller toplamda 2.5 milyon indirme almıştır.
DeepSeek’in daha büyük ve köklü rakiplerine karşı elde ettiği başarı “AI’yi alt üst etmek” ve “aşırı abartılmış” olarak tanımlanmaktadır. Şirketin bu başarısı, en azından kısmen, Nvidia’nın hisse fiyatının Ocak ayında %18 düşmesine ve OpenAI CEO’su Sam Altman‘dan halka açık bir yanıt almasına neden olmuştur. Mart ayında, ABD Ticaret Bakanlığı bürolarının çalışanlarına, DeepSeek’in hükümet cihazlarında yasaklanacağı bildirilmiştir.
Microsoft, DeepSeek’in Azure AI Foundry hizmetinde mevcut olduğunu duyurdu; bu, işletmeler için AI hizmetlerini tek bir çatı altında bir araya getiren Microsoft platformudur. DeepSeek’in Meta’nın AI harcamaları üzerindeki etkisi hakkında sorulduğunda, CEO Mark Zuckerberg, AI altyapısına harcamaların Meta için “stratejik avantaj” olmaya devam edeceğini belirtti. Mart ayında OpenAI, DeepSeek’i “devlet sübvanse edilmiş” ve “devlet kontrolündeki” bir kuruluş olarak nitelendirdi ve ABD hükümetine DeepSeek modellerinin yasaklanmasını önermektedir.
Nvidia‘nın dördüncü çeyrek kazanç görüşmesinde, CEO Jensen Huang, DeepSeek’in “mükemmel yeniliği” üzerinde durarak, bu ve diğer “akıl yürütme” modellerinin daha fazla işlem gücü talep ettiği için Nvidia için harika olduğunu vurgulamıştır.
Buna rağmen, bazı şirketler ve ülkeler, Güney Kore dahil, DeepSeek’i yasaklamaktadır. New York eyaleti de DeepSeek’in kamu cihazlarında kullanılmasını yasaklamıştır.
Mayıs ayında, Microsoft Başkan Yardımcısı ve Başkanı Brad Smith, bir Senato oturumunda, Microsoft çalışanlarının verilerin güvenliği ve propaganda endişeleri nedeniyle DeepSeek’i kullanmalarına izin verilmediğini belirtti.
DeepSeek’in gelecekte ne olacağına gelince, kesin bir şey yok. Geliştirilmiş modeller kaçınılmaz gibi görünüyor. Ancak, ABD hükümeti, zararlı yabancı etkileri algıladığı için artan bir endişe içindedir. Mart ayında Wall Street Journal, ABD’nin DeepSeek’i hükümet cihazlarında muhtemelen yasaklayacağını bildirmiştir.


