Qwen de olurdu. Buna Alibaba’nın Deepseek’e tepkisi ya da Çin’de üretilen yapay zeka modellerinde yapılan yakın bir işgalin sinyali diyebiliriz, ancak gerçekte böyle değil. Burada Hugging Face’te yazdığımız gibi, dünyada en popüler olan LLM açık kaynaklı platform (daha büyük dilsel modeller), üretken ve bilgisayar vizyonuyla çalışmak için araçlar ve kaynaklar bulmanın mümkün olduğu Qwen 2.5 modeline ulaştı. Bunların yarısı geçen ay. Uygulamada, Deepsek Alibaba’nın “bombası” nın kendisini en güncel ve güçlü versiyon olarak sunan Qwen 2.5-Max’i piyasaya süren birkaç gün sonra Meta’nın Lama 3.1’in üstesinden gelen dünyanın en popüler açık kaynaklı modelidir. Çin devi tarafından yayınlanan performans göstergelerine göre, Deepseek V3’ten değil, aynı zamanda GPT-O4 ve Claude 3.5 sonnet’e de daha yüksek olurdu.
Nasıl yapılır ve nasıl çalışır?
Sitelerini okursak Oyunun yerel rakipte (Deepseek) ve diğer açık kaynak modellerinde oynadığını tahmin ediyoruz. Bu pazarda bir hedef ve IBM de var. «Qwen2.5-Max-Write, Arena-Hard, Livebench, LiveCodebench ve GPQA-Diamond gibi kıyaslamada Deepseek V3’ü kırıyor. Temel modelleri karşılaştırdığımızda, GPT-4O ve CLAUDE-3.5-SONER gibi sahip modellerine erişemiyoruz. Bu nedenle, MOE açık ağırlıklı bir lider modeli olan Deepseek V3, en büyük açık ayak modeli Llam-3.1-405b ve aynı zamanda en iyi modeller arasında yer alan Qwen2.5-72b’ye kıyasla Qwen2.5-Max’ı değerlendiriyoruz. -Weight yoğun ».
Gizlilik ve güvenlik.
Gizlilik ve güvenlik cephesinde Deepseek gibi olağan kara delik var. Verilerimizin hükümetin erişebileceği Çinli sunucularda tutulması açısından. İtalyan Garantör, ChatGPT ile yapılanların ardından bir soruşturma başlattı. Şimdilik ilk duyarlı etki, uygulamanın İtalyan akıllı telefon mağazaları tarafından iptal edilmesidir.
Deepseek ile fark
Alibaba modeli kendisini Chatgpt gibi işlevler açısından sunar. İlk testten çok multimodal görünüyor, yani görüntüleri okuyor ve yorumlıyor ve videolar oluşturabiliyor. Çin hakkında bilgi istediğinizde daha da yumuşak görünüyor. Deepseek’te gördüğümüz blokların sahip olması anlamında. O zaman çevrimiçi olarak mevcuttur. Erişmek için önce bir Alibaba bulut hesabı kaydetmeli ve Alibaba Cloud Model Studio hizmetini etkinleştirmeli, ardından konsola göz atın ve bir API anahtarı oluşturun.


