
Çinli bir açık kaynaklı LLM olan Deepseek R1, Openai’nin en iyisine kıyasla üstün performansı için teknoloji manzarasında dalgalar yapıyor ve önemli ölçüde daha az bilgi işlem ve eğitim kaynağı gerektiriyor. Eski Intel CEO’su Pat Gelsinger X ve modeli övgü ile övdü. Bir sohbette TechCrunchgirişiminin Deepseek’i Openai üzerinden kullanacağını açıkladı.
Endüstri haberlerine ayak uydurmadıysanız, Pat Gelsinger geçen ay Intel’in CEO’su olarak istifa etti ve yerini iki ara CEO aldı. Spekülasyon, Intel’in hayal kırıklığı yaratan borsa sonuçlarının Gelsinger’in görevden alınmasına veya Kurul tarafından devredilmesine katkıda bulunduğunu göstermektedir. Bununla birlikte, Gelsinger şimdi kiliseler için bir mesajlaşma platformu olan yeni girişiminin Gloo’nun başkanı olarak görev yapıyor.
Gloo, kısaca AI ile çalışan bir chatbot olarak tanımlanan “Kallm” olarak adlandırılan bir AI hizmeti geliştiriyor. Deepseek’in R1 vs Openai’nin O1 modelini karşılaştırdıktan sonra, birincisi Gloo için daha iyi bir uyum, açık kaynak ve entegre edilmesi daha kolaydı. Gelsinger, “Gloo mühendislerim bugün R1 çalışıyor, O1’i çalıştırabilirlerdi – API’ler aracılığıyla O1’e sadece erişebilirler” dedi. Aşağıdaki tweet’i genişleterek, Gelsinger’in X’de biraz övgü paylaştığını ve Deepseek’e uygun fiyatlı AI getirdiği ve rekabet sürdüğü için teşekkür ettiğini göreceksiniz.
Bilgelik zaten bildiğimizi düşündüğümüz dersleri öğreniyor. Deepseek bize bilgi işlem geçmişinden üç önemli öğrenmeyi hatırlatıyor: 1) Hesaplama gaz yasasına uyuyor. Dramatik bir şekilde daha ucuz hale getirmek, pazarı genişletecektir. Piyasalar yanlış anlıyor, bu AI yapacak…27 Ocak 2025
Deepseek, R1 modelini eğitmek için NVIDIA’nın H800 GPU’larını kullandı, ancak maliyetlerden tasarruf etmek ve Western donanımına bağımlılığı azaltmak için (muhtemelen Huawei 910C) (muhtemelen Huawei 910C) (çoğunlukla) ev yapımı (muhtemelen Huawei 910C) ile yapıştı. Sam Atlman, 10 milyon dolar olan AI girişimlerinin “tamamen umutsuz” olduğunu açıkladı, ancak Deepseek, toplam eğitim harcamalarının sadece 5.6 milyon dolar olduğunu iddia ederken Meta’nın Llama 3 405B modelinden 11 kat daha az hesaplama gerektirdi.
Endüstri uzmanları bu rakamlara itiraz ettiler, ancak Gelsinger, “İşin çoğu Çin’de yapıldığı göz önüne alındığında, asla tam şeffaflığa sahip olmayacaksınız. Ama yine de, tüm kanıtlar eğitimlerinde O1’den daha ucuz.” Odak noktası, Deepseek’in sektörü, soruna donanım atmak yerine açık kaynaklı olmaya ve yaratıcı çözümler bulmaya nasıl zorladığı konusunda kaldı.
Deepseek, Microsoft ve Openai tarafından distilasyonda chatgpt’in verilerini yasadışı olarak kullandığı iddia edildiği için araştırılmaktadır. Benzer şekilde, Deepseek kullanıcı verileri ordularını toplar ve Çin merkezli sunucularda saklar, ancak en azından uygulamaları hakkında şeffaftırlar.

