DeepSeek’in Ticaret Kökenleri
DeepSeek, Yüksek-Filo Capital Management tarafından desteklenen bir Çinli kuantitatif hedge fonu olarak 2023 yılında kuruldu. Bu fon, ticaret kararlarını verirken Yapay Zeka (YZ) teknolojilerini kullanmasıyla bilinir. YZ tutkunu olan Liang Wenfeng, 2015 yılında Yüksek-Filo’yu kurdu. Zhejiang Üniversitesi’nde öğrenciyken ticaretle ilgilenmeye başlayan Wenfeng, 2019 yılında AI algoritmalarını geliştirmeye ve uygulamaya odaklanan bir hedge fonu olarak Yüksek-Filo’yu hayata geçirdi.
DeepSeek, finansal işinden ayrı olarak araştırmalara odaklanan bir laboratuvar olarak kuruldu. Bu laboratuvar için gerekli olan veri merkezi kümeleri, kuruluşundan itibaren tasarlayıp inşa etti. Ancak, Amerika Birleşik Devletleri’nin donanım ihracat yasaklarından etkilenerek, son zamanlarda çıkardığı bazı modelleri için daha düşük güçlü Nvidia H800 çiplerini kullanmak zorunda kaldı.
DeepSeek’in teknik ekibinin büyük ölçüde gençlerden oluştuğu belirtiliyor. Şirket, Çin’in önde gelen üniversitelerinden doktora araştırmacılarını agresif bir şekilde işe alıyor. Ayrıca bilgisayar bilimi konusunda geçmişi olmayan kişileri de teknoloji ekibine dahil ederek daha farklı konularda bilgi edinme sürecini hızlandırmayı hedefliyor.
DeepSeek’in Güçlü Modelleri
DeepSeek, ilk model setini – DeepSeek Coder, DeepSeek LLM, ve DeepSeek Chat – Kasım 2023’te duyurdu. Ancak, 2024 yazında piyasaya sürülen DeepSeek-V2 ailesi, yapay zeka endüstrisinin dikkatini çekmesine neden oldu. DeepSeek-V2, metin ve resim analizinde genel amaçlı bir sistem olarak çeşitli YZ kriterlerinde başarılı oldu ve o dönemdeki benzer modellere kıyasla çalıştırma maliyetleri oldukça düşüktü. Bu durum, DeepSeek’in yerel rakiplerinin, örneğin ByteDance ve Alibaba, bazı modellerinin kullanım fiyatlarını düşürmesine ya da tamamen ücretsiz hale getirmesine yol açtı.
Aralık 2024’te piyasaya sürülen DeepSeek V3, şirketin itibarını daha da artırdı. DeepSeek’in iç benchmark testlerine göre, DeepSeek V3, Meta’nın Llama modelinin yanı sıra sadece API aracılığıyla erişilebilen kapalı modellerden birçoğunu geride bıraktı. R1 adı verilen “akıl yürütme” modeli de dikkat çekiciydi. Bu model, OpenAI’nin benzerbir modeline karşı kıyaslandığında belirli kriterlerde aynı performansı gösteriyor.
R1, kendini doğru bir şekilde kontrol edebilme kapasitesine sahip olduğu için, genellikle yanlış anlamalara yol açan tuzakları aşma konusunda daha başarılı. Ancak R1 ve diğer modellerin bazı kısıtlamaları bulunuyor. Çin yönetmelikleri gereği, yanıtlarının temel sosyalist değerleri yansıtması bekleniyor; bu da bazı hassas konulara, örneğin Tiananmen Meydanı ve Tayvan’a bağımsızlık talepleri gibi başlıklara cevap verememesiyle sonuçlanıyor.
Mart ayında DeepSeek, 16.5 milyon ziyaretle kendini tekrar kanıtladı. Similarweb editörü David Carr, “Mart ayı için DeepSeek, günlük ziyaret sayısı açısından Şubat ayına göre %25’lik bir düşüş yaşamasına rağmen ikinci sırada yer aldı” dedi. Ancak, DeepSeek’in bu başarısı, ChatGPT gibi büyük yapay zeka uygulamalarının yanında sönük kalıyor.
Yıkıcı Bir Yaklaşım
DeepSeek’in bir iş modeli var mı yok mu, belirsiz. Şirket, ürün ve hizmetlerini piyasa değerinin çok altında fiyatlandırıyor ve bazılarını tamamen ücretsiz sunuyor. Buna rağmen, yatırımcı desteği almaktan kaçınıyor. DeepSeek, sağladığı verimlilik artışlarının bu denli rekabetçi fiyatlandırmayı mümkün kıldığını iddia etse de, bazı uzmanlar bu sayıları sorguluyor.
Her durumda, DeepSeek’in modelleri, genellikle açık kaynak olmasa da, ticari kullanıma izin veren esnek lisanslarla sunuluyor. Hugging Face platformunda, DeepSeek’in modellerini barındıran Clem Delangue, geliştiricilerin R1 modelinin 500’den fazla türev modelini oluşturduğunu ve toplamda 2.5 milyon indirme aldığını belirtiyor.
DeepSeek’in daha büyük ve köklü rakiplerine karşı elde ettiği başarı, yapay zekayı “yerinden oynatmak” ve “aşırı abartılmış” olarak tanımlandı. Şirketin başarısı, Ocak ayında Nvidia’nın hisse fiyatının %18 düşmesine neden oldu ve OpenAI CEO’su Sam Altman’dan kamuya açık yanıt almasına yol açtı. Mart ayında, ABD Ticaret Bakanlığı, çalışanlarına DeepSeek’in devlet cihazlarında yasaklandığını bildirdi.
Microsoft, DeepSeek’in Azure AI Foundry hizmetinde yer aldığını ve bu platformun, işletmelere yönelik YZ hizmetlerini bir araya getirdiğini açıkladı. Öte yandan, bazı şirketler ve ülkeler, geçerli nedenlerle DeepSeek’i yasaklamaktadır; Güney Kore’nin yanı sıra New York eyaleti de bu uygulamanın hükümet cihazlarında kullanılmasını yasakladı.
Mayıs ayında Microsoft’un başkan yardımcısı Brad Smith, bir Senato oturumunda çalışanlarının DeepSeek’i kullanmasına izin verilmediğini açıkladı. Gelecekte ne olacağı tam olarak kestirilemese de, daha iyi modellerin geliştirilmesi bekleniyor. Ancak ABD hükümeti, zarar verme potansiyeli taşıyan yabancı etkileri konusunda artan bir kaygı taşımakta.


