AMD, Exascale HPC için Instinct MI210 PCIe Kartını Tanıttı

AMD, bilgi işlem performansına ihtiyaç duyan veri merkezleri, sunucular ve iş istasyonları için Instinct MI210 PCIe hızlandırıcı kartını resmi olarak tanıttı. Instinct MI210, bir CDNA 2 hesaplama GPU’sunu temel alır ve 64 GB HMB2E bellek taşır. Bu kartla AMD, Nvidia’nın on yılı aşkın süredir başarılı olduğu ticari yüksek performanslı bilgi işlem (HPC) pazarındaki saldırısını başlatıyor.

Çift yonga kullanan daha büyük MI250/MI250X’in aksine, AMD Instinct MI210 kartı, 104 işlem birimi (6656 akış işlemcisi) içeren tek bir CDNA 2 grafik hesaplama kalıbı (GCD) kullanır ve 64 GB HBM2E ECC belleği 4096 bit arabirim kullanır . Kartın 2 yönlü ve 4 yönlü Infinity yapı konektörleri vardır, bu nedenle iki veya dört kart tek bir sistemde birlikte çalışarak performansı ikiye veya dört katına çıkarabilir. Anakart, pasif bir çift geniş soğutma sistemi kullanır, bu nedenle tipik masaüstü PC’niz için değil, rafa monte sunucular veya özel iş istasyonları için tasarlanmıştır. Bir adet sekiz pimli yardımcı PCIe güç konektörü gerektirir; bu, PCIe yuvasını ve konektörünü kullanarak maksimum güç tüketiminin yalnızca 225W olduğu anlamına gelir.

Resim 1 / 7

(İmaj kredisi: AMD)

Resim 2 / 7

AMD Radeon Instinct MI210 görüntüleri ve slaytları — (İmaj kredisi: AMD)

Resim 3 / 7

Resim 4 / 7

Resim 5 / 7

Resim 6 / 7

Resim 7 / 7

Hesaplama yetenekleri açısından, Instinct MI210 kartı, diğer Instinct MI200 serisi CDNA 2 hesaplama GPU’ları tarafından desteklenen aynı veri biçimlerini (FP64/FP32 vektör/matris, FP16, bfloat16, INT8) destekler, ancak performans açısından Instinct MI210, iki GCD’ye sahip olan, bir OCP hızlandırıcı modülü (OAM) form faktörüne sahip olan ve doğal olarak önemli ölçüde daha fazla güç tüketen Instinct MI250’nin yarısını sunar.

AMD’nin Instinct MI210 anakartının bariz rakibi, yaklaşık bir yıl önce piyasaya sürülen Nvidia’nın A100 80GB PCIe kartıdır (80GB versiyonunda). Kağıt üzerinde, AMD’nin CDNA 2 tabanlı çözümü, FP64/FP32 vektör ve matris işlemlerinde rakibini iki kat geride bırakıyor. Buna karşılık, Nvidia’nın A80’i FP16, bfloat16 ve INT8 gibi AI/ML’ye özgü formatlarla daha hızlıdır.

	İçgüdü MI210	Nvidia A100 80GB PCIe	İçgüdü MI250	İçgüdü MI250X
Hesaplama Birimleri	104	–	208	220
Akış İşlemcileri	6.656	6.912	13.312	14,080
FP64 Vektörü (Tensor)	22,6 TFLOP	9.7 TFLOP	45.3 TFLOP	47.9 TFLOP
FP64 Matrisi	45.3 TFLOP	19,5 TFLOP	90,5 TFLOP	95,7 TFLOP
FP32 Vektör	22,6 TFLOP	9.7 TFLOP (?)	45.3 TFLOP	47.9 TFLOP
FP32 Tensör Şamandırası	–	156 \| 312 TFLOP	–	–
FP32 Matrisi	45.3 TFLOP	19,5 TFLOP	90,5 TFLOP	95,7 TFLOP
FP16	181 TL	312 \| 624* TFLOPS	362.1 TFLOPS	383 TFLOP
bfloat16	181 TL	312 \| 624* TFLOPS	362.1 ÜSTLER	383 ÜÇ
INT8	181 ÜÇ	624 \| 1248 ÜST	362.1 ÜSTLER	383 ÜÇ
HBM2E ECC Bellek	64 GB	80 GB	128 GB	128 GB
Bellek Bant Genişliği	1,6 TB/sn	1.935 TB/sn	3,2 TB/sn	3,2 TB/sn
Form faktörü	PCIe kartı	PCIe kartı	OAM	OAM

* kıtlık ile

AMD, Instinct MI210 kartının yanı sıra ROCm 5 yazılım geliştirme platformu Bu, kullanıcıların AMD’nin GPU’larını verimli bir şekilde programlamasını sağlar ve çeşitli açık çerçeveleri (Tensorflow/PyTorch), kitaplıkları (MIOpen/Blas/RCCL), programlama modelini (HIP), ara bağlantıyı (OCD) vb. destekler. Ayrıca AMD, Nvidia’nın GPU’ları için optimize edilmiş HPC ve AI/MP uygulamalarını barındıran Infinity Hub’a sahiptir.

Ancak bugünün duyurusunun belki de en önemli kısmı, AMD’nin Instinct MI210 kartlarıyla donatılmış makineler sunmak için çeşitli sunucu üreticileriyle birlikte çalışıyor olmasıdır. Önümüzdeki aylarda bu tür sistemler Asus, Colfax, Dell, Exxact, Gigabyte, HPE, KOI, Lenovo, Nor-Tech Supermicro ve Penguin’den temin edilebilecek.

Şu anda, yüksek performanslı AI/ML veya HPC yeteneklerine ihtiyaç duyan birçok işletme ve kuruluş, yalnızca Nvidia tabanlı makineleri tanınmış OEM’lerden alabilir. AMD’nin Instinct MI210’u ile artık başka bir seçeneğe sahipler. Nvidia’nın CUDA platformu için halihazırda geliştirilmiş ve optimize edilmiş düzinelerce program olduğundan AMD’nin bu ticari HPC pazarından kısa sürede önemli bir pay almasını beklemiyoruz ve AMD’ler için karşılaştırılabilir bir yazılım kitaplığının kullanıma sunulması uzun zaman alacak. ROCM platformu.

Resim 1 / 16