
AMD, Deepseek’in AI modeliyle NVIDIA RTX 4090 ve RTX 4080 Super’a karşı başa çıkmaya başlayan amiral gemisi RX 7900 XTX’in kriterlerini sağladı. Buna göre David McAfee on xRDNA3 tabanlı GPU, RTX 4090’ı% 13’e kadar ve RTX 4080 süper% 34’e kadar daha iyi performans gösterdi.
AMD, üç GPU’yu Deepseek R1 kullanarak birden fazla LLM ve çeşitli parametrelerle test etti. RX 7900 XTX, Deepseek R1 Distill Qwen 7b’yi kullanarak RTX 4090’a karşı en büyük zaferini gördü ve burada ADA Lovelace GPU’dan%13 daha iyi performans gösterdi. AMD ayrıca RTX 4090’a karşı diğer üç LLM konfigürasyonunu test etti. RX 7900 XTX, üç konfigürasyondan ikisinde RX 4090’dan daha iyi performans gösterdi – Distill Lama 8b ve Distill QWEN 14B kullanılarak% 2 daha yüksek kullanılarak% 11 daha yüksekti. RX 4090, Distill Qwen 32b kullanılarak bir konfigürasyonda RX 7900 XTX’ten% 4 daha hızlıydı.
Deepseek @Amdradeon 7900 XTX üzerinde çok iyi performans gösteriyor. Radeon GPUS ve Ryzen AI Apus’ta nasıl çalışacağınızı buradan öğrenin: https://t.co/fvldlj18ov pic.twitter.com/5okekyjjh329 Ocak 2025
AMD, RTX 4080 Super’a karşı üç konfigürasyonu test etti. RX 7900 XTX, RTX 4080 Super’dan Deepseek R1 Distill Qwen 7B’yi kullanarak% 34’ü daha iyi performans gösterdi. Bu kurşun Distill Lama 8b kullanarak% 27’ye düştü ve Distill Qwen 14b kullanılarak% 22.
NVIDIA GPU’larının testler için nasıl yapılandırıldığından emin olamadığımız için, bunların hepsi bir tutam tuzla alınmalıdır (yine AMD tarafından çalıştırıldı). Tüm AI iş yükleri bir GPU’nun tam hesaplama veriminden yararlanamaz. Bunu stabil difüzyonun işleme için FP8 hesaplamaları veya tensorrt kodu kullanmadığı stabil difüzyon testlerimizde gördük.
RX 7900 XTX’in özel bir AI işlemci olarak kullanılması yaygın değildir, ancak mimari AI iş yüklerini işlemekten daha fazlasıdır. RX 7900 XTX’in dayandığı RDNA 3 mimarisi, BF16 ve INT8’i destekleyen matris işlemlerini kullanabilir. AMD, AI-işleme yeteneğini göstermek için RDNA 3’e “AI hızlandırıcı” terminolojisini resmen ekledi. RX 7900 XTX 192 AI hızlandırıcılara sahiptir.
AMD kısa süre önce müşterilerinin RX 7900 XTX de dahil olmak üzere uyumlu AMD tüketici tabanlı donanım üzerinde çalışması için Deepseek R1’i nasıl alabileceğine dair bir eğitim yayınladı. Deepseek R1, Batı önde gelen AI modelleriyle karşılaştırılabilir, ancak bilgi işlem maliyetinin bir kısmında performans sunan yeni bir AI modelidir. Deepseek R1, NVIDIA’nın montaj benzeri PTX programlama dilini kullanmak da dahil olmak üzere, modelini rakiplerinden 11 kat daha hızlı çalıştırmak için çeşitli donanım tabanlı optimizasyonlar kullanıyor.

