Deepseek viral oldu.
Chinese AI laboratuvar Deepseek, chatbot uygulaması Apple App Store listelerinin (ve Google Play) tepesine yükseldikten sonra bu hafta ana akım bilincine girdi. Deepseek’in hesaplama tasarruflu teknikler kullanılarak eğitilen AI modelleri, ABD’nin AI yarışında liderliğini koruyup koruyamayacağını ve AI cipsine olan talebin devam edip etmeyeceğini sorgulamak için Wall Street analistlerine ve teknoloji uzmanlarına yol açtı.
Ama Deepseek nereden geldi ve uluslararası şöhrete nasıl bu kadar hızlı yükseldi?
Deepseek’in Tüccar Kökenleri
Deepseek, ticaret kararlarını bilgilendirmek için AI kullanan Çin nicel bir hedge fonu olan High Flyer Capital Management tarafından desteklenmektedir.
AI meraklısı Liang Wenfeng, 2015 yılında High-Flyer’i kurdu. Zhejiang Üniversitesi’nde bir öğrenci iken ticarette uğraşmaya başladığı bildirildi.
2023’te High-Flyer, Deepseek’e finansal işinden ayrı AI araçlarını araştırmaya adanmış bir laboratuvar olarak başladı. Yatırımcılarından biri olarak High-Flyer ile laboratuvar kendi şirketine döndü, Deepseek olarak da adlandırıldı.
İlk günden itibaren Deepseek, model eğitimi için kendi veri merkezi kümelerini oluşturdu. Ancak Çin’deki diğer AI şirketleri gibi, Deepseek de ABD’nin donanımdaki ihracat yasaklarından etkilenmiştir. Daha yeni modellerinden birini eğitmek için şirket, ABD şirketleri için mevcut olan bir çip olan H100’in daha az güçlü bir versiyonu olan Nvidia H800 yongalarını kullanmak zorunda kaldı.
Deepseek’in teknik ekibinin Young’ı eğri olduğu söyleniyor. Şirket Bildirildiğine göre agresif bir şekilde işe alınır En iyi Çin üniversitelerinden doktora yapay zeka araştırmacıları. Deepseek ayrıca bilgisayar bilimi geçmişi olmayan insanları işe alır New York Times’a göre teknolojisinin çok çeşitli konuları daha iyi anlamalarına yardımcı olmak.
Deepseek’in güçlü modelleri
Deepseek, Kasım 2023’te ilk model setini-Deepseek kodlayıcı, Deepseek LLM ve Deepseek Chat-tanıttı. Ancak geçen bahara kadar, başlangıçta yeni nesil Deepseek-V2 model ailesini yayınladığında, AI endüstrisi. dikkat çekmeye başladı.
Genel amaçlı bir metin ve görüntü analiz sistemi olan Deepseek-V2, çeşitli AI ölçütlerinde iyi performans gösterdi ve o zaman karşılaştırılabilir modellerden çok daha ucuzdu. Deepseek’in bayta ve Alibaba da dahil olmak üzere iç yarışmasını, bazı modelleri için kullanım fiyatlarını azaltmaya ve başkalarını tamamen özgür kılmaya zorladı.
Aralık 2024’te piyasaya sürülen Deepseek-V3, sadece Deepseek’in kötü şöhretine eklendi.
Deepseek’in dahili kıyaslama testine göre, Deepseek V3, Meta’s Lama ve “Kapalı” modeller gibi, yalnızca API aracılığıyla Openai’nin GPT-4O gibi erişilebilen indirilebilir, açık şekilde mevcut modellerden daha iyi performans gösterir.
Aynı derecede etkileyici olan Deepseek’in R1 “Akıl Yürütme” modeli. Ocak ayında piyasaya sürülen Deepseek, R1’in ve Openai’nin O1 modelini temel ölçütlerde gösterdiğini iddia ediyor.
Bir akıl yürütme modeli olan R1, normalde modelleri gezen bazı tuzaklardan kaçınmasına yardımcı olan etkili bir şekilde gerçekleştirir. Akıl yürütme modelleri, tipik bir mantıksız modele kıyasla çözümlere ulaşmak için biraz daha uzun sürer-genellikle saniye ila dakika daha uzun sürer. Yukarı tarafı, fizik, bilim ve matematik gibi alanlarda daha güvenilir olma eğiliminde olmalarıdır.
Ancak R1, Deepseek V3 ve Deepseek’in diğer modellerinin bir dezavantajı var. Çince geliştirilmiş yapay zeka olarak kıyaslama Çin’in internet düzenleyicisi tarafından “temel sosyalist değerleri somutlaştırmasını” sağlamak için. Örneğin Deepseek’in Chatbot uygulamasında R1, Tiananmen Meydanı veya Tayvan’ın özerkliği hakkında soruları cevaplamayacak.
Yıkıcı bir yaklaşım
Deepseek’in bir iş modeli varsa, bu modelin tam olarak ne olduğu açık değil. Şirket, ürün ve hizmetlerini piyasa değerinin çok altında fiyatlandırıyor ve başkalarına ücretsiz olarak veriyor.
Deepseek’in söylediği gibi, verimlilik atılımları aşırı maliyet rekabet gücünü korumasını sağladı. Bazı uzmanlar anlaşmazlık Ancak şirketin sağladığı rakamlar.
Durum ne olursa olsun, geliştiriciler, ifade yaygın olarak anlaşıldığı için açık kaynak olmayan, ancak ticari kullanıma izin veren izin veren lisanslar altında mevcut olan Deepseek’in modellerine götürdüler. Deepseek’in modellerini barındıran platformlardan biri olan Hugging Face’in CEO’su Clem Delangue’ye göre Hugging Face’teki geliştiriciler 500’den fazla “türev” modeli R1 yarattı Bu 2,5 milyon indirme bir araya geldi.
Deepseek’in daha büyük ve daha yerleşik rakiplere karşı başarısı “AI’nın yükselmesi” olarak tanımlanır ve “aşırı hiper.” Şirketin başarısı en azından kısmen Nvidia’nın hisse senedi fiyatının Pazartesi günü% 18 düşmesine neden olmaktan sorumlu ve halka açık bir yanıt almak Openai CEO’su Sam Altman’dan.
Microsoft, DeepSeek’in Microsoft’un Platformu AIDE Platformunda, AI hizmetlerini tek bir afiş altında işletmeler için bir araya getiren Azure AI Foundry hizmetinde mevcut olduğunu duyurdu. Deepseek’in ilk çeyrek kazanç çağrısı sırasında Meta’nın AI harcamaları üzerindeki etkisi sorulduğunda, CEO Mark Zuckerberg, AI altyapısına yapılan harcamaların Meta için “stratejik bir avantaj” olmaya devam edeceğini söyledi.
Aynı zamanda, bazı şirketler Deepseek’i yasaklıyor ve tüm ülkeler Ve Hükümetler. New York Eyaleti de Deepseek’in hükümet cihazlarında kullanılmasını yasakladı.
Deepseek’in geleceğinin ne olabileceği gelince, bu belli değil. Geliştirilmiş modeller verilmiştir. Ama ABD hükümeti Zararlı yabancı etki olarak algıladığı şey konusunda dikkatli olmak.
TechCrunch AI odaklı bir bülten var! Her Çarşamba günü gelen kutunuza almak için buraya kaydolun.
Bu hikaye başlangıçta 28 Ocak 2025 yayınlandı ve daha fazla bilgi ile sürekli olarak güncellenecek.

