yeni bir teknik blogNVIDIA nihayet mevcut Ampere A100 hızlandırıcısını AMD Instinct MI250 GPU’ları ile karşılaştıran bazı sayıları paylaştı.

NVIDIA, AMD’nin Instinct MI250’sine Karşı Ampere A100 GPU’lar İçin 2 Kat Daha Yüksek Performans ve Neredeyse 3 Kat Verimlilik İddiasında Bulunuyor

NVIDIA, bu yıl içinde müşterilere gönderilecek olan Hopper grafik (GPU) mimarisine dayalı yeni nesil H100 GPU’yu zaten duyurdu. Hopper GPU, altı yıl önce piyasaya sürülen Pascal P100’e göre tahmini 26 kat performans artışı sağlayacak ve bu, Moore Yasası’nın sunduğu yörüngeden 3 kat daha hızlı.

NVIDIA, ISC 2022’de ConnectX-7’yi Sergiliyor: 8 Milyar Transistörlü Yeni Nesil Anahtar

Performans testlerine gelince, NVIDIA Ampere A100 GPU’yu hem tekli hem de çoklu GPU yapılandırmalarında test etti. AMD’den Instinct MI250 için aynı konfigürasyonlar kullanıldı. LAMMPS, NAMD, openMM, GROMACS & AMBER gibi en popüler Veri Merkezi iş yüklerinden bazıları performans testleri için kullanıldı.

NVIDIA’nın tek Amper A100 GPU’su, AMD Instinct MI250 GPU hızlandırıcısından 1,9 kata kadar daha hızlı çıktı, dörtlü GPU çözümü ise Ampere sistemi için 2,1 kat kazanç gösterdi. Enerji verimliliğinde, dörtlü GPU çözümü 2,8 kat daha yüksek performans/watt sağladı.

NVIDIA A100 GPU’nun mükemmel performansı ve güç verimliliği, uygulama performansını ve verimliliğini en üst düzeye çıkarmak için uzun yıllar süren amansız yazılım-donanım birlikte optimizasyonunun sonucudur. NVIDIA Ampere mimarisi hakkında daha fazla bilgi için bkz. NVIDIA A100 Tensör Çekirdek GPU Beyaz kağıt.

A100 ayrıca işletim sistemine tek bir işlemci olarak sunulur ve performansından tam olarak yararlanmak için yalnızca bir MPI sıralamasının başlatılmasını gerektirir. Ve A100, ölçek sayesinde mükemmel performans sunar. 600 GB/sn NVLink bağlantıları bir düğümdeki tüm GPU’lar arasında.

Testten notlar aşağıdadır:

A100 ile MI250 arasında gösterilen verimlilik oranı – daha yüksek NVIDIA için daha iyidir. Uygulama başına birden çok veri kümesi (değişir) üzerinden Geomean. Verimlilik, NVIDIA SMI ve ROCm |

AMD MI250, AMD Infinity Fabric™ teknolojisine sahip 4x AMD Instinct™ MI250 OAM (128 GB HBM2e) 500W GPU’lu (2) AMD EPYC 7763 ile bir GIGABYTE M262-HD5-00 üzerinde ölçülmüştür. NVIDIA, çift EPYC 7713 CPU ve 4x A100 (80 GB) SXM4 kullanarak ProLiant XL645d Gen10 Plus üzerinde çalışır

LAMMPS geliştirme_db00b49(AMD) geliştirme_2a35ec2(NVIDIA) veri kümeleri ReaxFF/c, Tersoff, Leonard-Jones, SNAP | NAMD 3.0alpha9 veri kümesi STMV_NVE | OpenMM 7.7.0 Veri kümeleri için topluluk çalışır: amber20-stmv, amber20-selüloz, apoa1pme, pme|

GROMACS 2021.1(AMD) 2022(NVIDIA) veri kümeleri ADH-Dodec (h-bond), STMV (h-bond) | AMBER 20.xx_rocm_mr_202108(AMD) ve 20.12-AT_21.12 (NVIDIA) veri kümeleri Cellulose_NVE, STMV_NVE | 1x MI250, 2x GCD’ye sahiptir

NVIDIA aracılığıyla

Şimdi, burada kullanılan AMD Instinct MI250’nin, MI250X’e oturduğu için tam yapılandırma olmadığını, ancak bu sonuçlara dayanarak, A100’ün AMD CDNA 2 tekliflerine karşı hala çok rekabetçi olması gerektiği belirtilmelidir. Yakında Hopper’ın gelmesiyle NVIDIA bu rakamları daha da ileriye taşıyacak ve AMD’nin Instinct MI300’ü yepyeni APU benzeri tasarımıyla burada devreye giriyor.



genel-17