- Deepseek’in popülerlik artışından sonra Nvidia, AI yeni gelen hakkında yorum yapıyor
- Nvidia Deepseek’e ‘mükemmel bir AI ilerlemesi’ diyor
- Nvidia, GPU’larının hala kritik öneme sahip olduğunu ima ediyor
Hafta sonu Deepseek hakkındaki yaygarayı duymamış olsaydınız, en azından şimdiye kadar terimi duymuşsunuzdur. Şöhrete yükseldi çünkü Chatgpt’e fiyatın bir kısmında gerçek bir rakip sağladı ve teknoloji hisse fiyatlarının düştüğünü görerek borsada kargaşaya neden oldu. Nvidia özellikle rekor kırdı 600 milyar dolarlık hisse fiyat düşüşütarihin en büyük hisse fiyatı düşüşü.
Aynı adı taşıyan Çinli bir girişim tarafından yayınlanan Deepseek, Openai’nin Chatgpt gibi şeyler almaya yönelik hırsları olan ücretsiz bir AI chatbot. Ayrıca, özellikle görüntü oluşturma ve analizde olmak üzere bazı multimodal özelliklere sahip yeni modeller de vardır. AI dünyasını fırtına ile aldı ve hala ABD ve Birleşik Krallık’taki Apple’ın App Store’da bir numaralı uygulamadır.
Uygulama ve web sitesi popüler oldu, Deepseek bir kesinti ve bildirilen bir ‘kötü niyetli saldırı’ yaşadı.
Openai’nin genel müdürü Sam Altman cevap verirken, AI dalgası büyümeye devam ettikçe ön plana çıkan AI yongalarında küresel lider olan Nvidia’dan da duyduk.
Techradar’a e -postayla gönderilen bir açıklamada, Nvidia yazdı, “Deepseek mükemmel bir AI ilerlemesi ve test süresi ölçeklendirmesinin mükemmel bir örneğidir. Deepseek’in çalışmaları, bu teknik kullanılarak yeni modellerin nasıl oluşturulabileceğini, geniş çapta kullanılabilir modellerden yararlanabileceğini ve tamamen dışa aktarma kontrolü uyumlu olan hesaplamayı göstermektedir. Çıkarım, önemli sayıda NVIDIA GPU ve yüksek performanslı ağ gerektirir. Şimdi üç ölçeklendirme yasamız var: eğitim öncesi ve eğitim sonrası, devam eden yeni test zamanı ölçeklendirme. ”
Deepseek’in Deepseek’in R1 modelinin performansına değinen “mükemmel bir AI ilerlemesi” olarak adlandırılan kesinlikle güçlü. Ayrıca ne bildiğimizi de doğrular: Yeni modeller tamamen yenilerini oluşturmak yerine mevcut modeller ve yongalar kullanılarak oluşturulabilir.
Nvidia açıkça önemli bir rol olarak kalmak istiyor, bu tür bir sunumun çok fazla Nvidia GPU’si gerektirdiğini ve Deepseek’in Çin’e özgü Nvidia GPU’larını kullandığı gerçeğini oynadığını belirtti. Çizgiler arasında okurken, Deepseek’in bir noktada daha fazla cipsine ihtiyacı olacağını ima ediyor.
Deepseek, kendi kendini geliştirmek için deneme yanılma kullanarak LLM’lerini geliştirmek için yenilikçi yeni bir eğitim süreci kullandığını iddia ediyor. LLM’lerini, eylemlerine dayanarak geri bildirim alarak insanların öğrendikleri gibi eğittiğini söyleyebilirsiniz. Ayrıca bir MOE (ekspertler karışımı) mimarisi kullanıldı, yani herhangi bir zamanda parametrelerinin sadece küçük bir kısmını aktive ederek hesaplama maliyetini önemli ölçüde azaltarak daha verimli hale getirdi.
Sam Altman ayrıca Deepseek’in R1 modelini, “özellikle fiyat için neler sunabileceklerini” övdü. Openai’nin “çok daha iyi modeller sunacağını” yineledi, ancak rekabeti memnuniyetle karşıladı. Nvidia gelecekteki kartlarını göğsüne yakın tutuyor gibi görünüyor.
Deepseek AI’nın yeni kayıtlara ne zaman döneceğini ve tam performansa geri döneceğini görmek için hala bir tür bekleme oyunu, ancak kalma gücünü merak ediyorsanız, meslektaşım Lance Ulanoff’un-Techradar’ın editörü-AT-LARGE – Düşünceler Amerika Birleşik Devletleri’nde dolaşma şansı üzerine. Birlikte Deepseek AI ve Chatgpt ve Techradar’ın AI uzmanlarından John-Anthony Disotto’dan.


