AMD, bilgi işlem performansına ihtiyaç duyan veri merkezleri, sunucular ve iş istasyonları için Instinct MI210 PCIe hızlandırıcı kartını resmi olarak tanıttı. Instinct MI210, bir CDNA 2 hesaplama GPU’sunu temel alır ve 64 GB HMB2E bellek taşır. Bu kartla AMD, Nvidia’nın on yılı aşkın süredir başarılı olduğu ticari yüksek performanslı bilgi işlem (HPC) pazarındaki saldırısını başlatıyor.
Çift yonga kullanan daha büyük MI250/MI250X’in aksine, AMD Instinct MI210 kartı, 104 işlem birimi (6656 akış işlemcisi) içeren tek bir CDNA 2 grafik hesaplama kalıbı (GCD) kullanır ve 64 GB HBM2E ECC belleği 4096 bit arabirim kullanır . Kartın 2 yönlü ve 4 yönlü Infinity yapı konektörleri vardır, bu nedenle iki veya dört kart tek bir sistemde birlikte çalışarak performansı ikiye veya dört katına çıkarabilir. Anakart, pasif bir çift geniş soğutma sistemi kullanır, bu nedenle tipik masaüstü PC’niz için değil, rafa monte sunucular veya özel iş istasyonları için tasarlanmıştır. Bir adet sekiz pimli yardımcı PCIe güç konektörü gerektirir; bu, PCIe yuvasını ve konektörünü kullanarak maksimum güç tüketiminin yalnızca 225W olduğu anlamına gelir.
Hesaplama yetenekleri açısından, Instinct MI210 kartı, diğer Instinct MI200 serisi CDNA 2 hesaplama GPU’ları tarafından desteklenen aynı veri biçimlerini (FP64/FP32 vektör/matris, FP16, bfloat16, INT8) destekler, ancak performans açısından Instinct MI210, iki GCD’ye sahip olan, bir OCP hızlandırıcı modülü (OAM) form faktörüne sahip olan ve doğal olarak önemli ölçüde daha fazla güç tüketen Instinct MI250’nin yarısını sunar.
AMD’nin Instinct MI210 anakartının bariz rakibi, yaklaşık bir yıl önce piyasaya sürülen Nvidia’nın A100 80GB PCIe kartıdır (80GB versiyonunda). Kağıt üzerinde, AMD’nin CDNA 2 tabanlı çözümü, FP64/FP32 vektör ve matris işlemlerinde rakibini iki kat geride bırakıyor. Buna karşılık, Nvidia’nın A80’i FP16, bfloat16 ve INT8 gibi AI/ML’ye özgü formatlarla daha hızlıdır.
İçgüdü MI210 | Nvidia A100 80GB PCIe | İçgüdü MI250 | İçgüdü MI250X | |
Hesaplama Birimleri | 104 | – | 208 | 220 |
Akış İşlemcileri | 6.656 | 6.912 | 13.312 | 14,080 |
FP64 Vektörü (Tensor) | 22,6 TFLOP | 9.7 TFLOP | 45.3 TFLOP | 47.9 TFLOP |
FP64 Matrisi | 45.3 TFLOP | 19,5 TFLOP | 90,5 TFLOP | 95,7 TFLOP |
FP32 Vektör | 22,6 TFLOP | 9.7 TFLOP (?) | 45.3 TFLOP | 47.9 TFLOP |
FP32 Tensör Şamandırası | – | 156 | 312 TFLOP | – | – |
FP32 Matrisi | 45.3 TFLOP | 19,5 TFLOP | 90,5 TFLOP | 95,7 TFLOP |
FP16 | 181 TL | 312 | 624* TFLOPS | 362.1 TFLOPS | 383 TFLOP |
bfloat16 | 181 TL | 312 | 624* TFLOPS | 362.1 ÜSTLER | 383 ÜÇ |
INT8 | 181 ÜÇ | 624 | 1248 ÜST | 362.1 ÜSTLER | 383 ÜÇ |
HBM2E ECC Bellek | 64 GB | 80 GB | 128 GB | 128 GB |
Bellek Bant Genişliği | 1,6 TB/sn | 1.935 TB/sn | 3,2 TB/sn | 3,2 TB/sn |
Form faktörü | PCIe kartı | PCIe kartı | OAM | OAM |
* kıtlık ile
AMD, Instinct MI210 kartının yanı sıra ROCm 5 yazılım geliştirme platformu Bu, kullanıcıların AMD’nin GPU’larını verimli bir şekilde programlamasını sağlar ve çeşitli açık çerçeveleri (Tensorflow/PyTorch), kitaplıkları (MIOpen/Blas/RCCL), programlama modelini (HIP), ara bağlantıyı (OCD) vb. destekler. Ayrıca AMD, Nvidia’nın GPU’ları için optimize edilmiş HPC ve AI/MP uygulamalarını barındıran Infinity Hub’a sahiptir.
Ancak bugünün duyurusunun belki de en önemli kısmı, AMD’nin Instinct MI210 kartlarıyla donatılmış makineler sunmak için çeşitli sunucu üreticileriyle birlikte çalışıyor olmasıdır. Önümüzdeki aylarda bu tür sistemler Asus, Colfax, Dell, Exxact, Gigabyte, HPE, KOI, Lenovo, Nor-Tech Supermicro ve Penguin’den temin edilebilecek.
Şu anda, yüksek performanslı AI/ML veya HPC yeteneklerine ihtiyaç duyan birçok işletme ve kuruluş, yalnızca Nvidia tabanlı makineleri tanınmış OEM’lerden alabilir. AMD’nin Instinct MI210’u ile artık başka bir seçeneğe sahipler. Nvidia’nın CUDA platformu için halihazırda geliştirilmiş ve optimize edilmiş düzinelerce program olduğundan AMD’nin bu ticari HPC pazarından kısa sürede önemli bir pay almasını beklemiyoruz ve AMD’ler için karşılaştırılabilir bir yazılım kitaplığının kullanıma sunulması uzun zaman alacak. ROCM platformu.
.