Barselona Süper Bilgisayar Merkezi ve New York Eyalet Üniversitesi yayınlanan kıyaslamalar Bu, Intel’in 48 çekirdekli Sapphire Rapids CPU’larından ikisiyle tam olarak boy ölçüşemeyen Nvidia’nın yepyeni Grace Superchip’inin hünerini gösteriyor. Grace, dünyayı sarsan bir performansa sahip olmasa da verimliliği sayesinde rekabetçi bir veri merkezi ve HPC işlemci olmayı vaat ediyor.
Grace, Nvidia’nın Arm mimarisi üzerine kurulu ilk ev yapımı sunucu CPU’sudur. Tek bir Grace CPU, 72 çekirdek ve 480 GB LPDDR5X bellekle birlikte gelir. Tek başına bir Grace CPU satın almak mümkün olmasa da, Grace-Hopper işlemcilerdeki Hopper GPU’larının yanında bulunuyor ve Nvidia, toplam 144 çekirdek ve 960 GB LPDDR5X için tek bir kartta birleştirilmiş iki Grace CPU’lu Grace Superchip’i sunuyor.
Geçtiğimiz hafta HPC Asya konferansında gösterilen kıyaslamalar belki de şu ana kadar gördüğümüz en ayrıntılı kıyaslamalar; Barselona ve New York araştırmacılarının her biri bulgularını konferansta sunuyor. Her grup farklı şekilde test yaptı; Barselona kıyaslamaları Grace’in Skylake-X’e göre performansına odaklandı ve New York testleri Grace’i diğer çeşitli AMD ve Intel CPU’larla karşılaştırdı.
Barselona araştırmacıları Grace-Hopper’ı (GPU parçası olmadan – aslında tek bir Grace CPU) ve Grace Superchip’i bir çift 24 çekirdekli Xeon Platinum 8160’a karşı test etti. Skylake-X’in 2024’te yedi yaşına gireceği göz önüne alındığında, Grace Superchip’in en kötü performansını sergileyen 48 çekirdekli Skylake-X sunucusundan hala %67 daha hızlı olması şaşırtıcı değildi; Superchip’in en iyi sonucu 4,49x’lik bir farkla elde edildi. Barselona Süper Bilgi İşlem Merkezi, Intel destekli MareNostrum 4’ü Nvidia’nın Grace’iyle değiştirdiğinden CPU karşılaştırması seçimi tuhaf ama keyfi değil.
New York kıyaslamaları, Intel Sapphire Rapids ve Ice Lake, AMD’nin Milan’ı ve Amazon’un Graviton 3 ve Fujitsu’nun A64FX formundaki rakip Arm tabanlı işlemcileriyle karşılaştırmaları içerdiği göz önüne alındığında daha ilginç. Grace Superchip, tüm kıyaslamalarda Graviton 3’ü, A64FX’i, 80 çekirdekli Ice Lake kurulumunu ve hatta Milan’ın 128 çekirdekli konfigürasyonunu kolayca geride bıraktı. Ancak iki adet 48 çekirdekli Xeon Max 9468’e sahip Sapphire Rapids sunucusu Grace’in galibiyet serisini durdurdu.
Satır 0 – Hücre 0 | Lütuf | Safir Rapids HBM | Safir Rapids DDR5 |
Matris Çarpımı | 4.461 | 5.392 | 4.787 |
LINPACK | 3.120 | 2.862 | 2.211 |
FFT | 134.2 | 143.1 | 129 |
HPCG | 106.5 | 197.5 | 83.6 |
OpenFOAM (daha düşük olan daha iyidir) | 5.46 | 6.87 | 6.89 |
Gromacs MEM | 171 | 206.1 | 203.64 |
Gromacs kaburga | 12.7 | 13.52 | 13.88 |
Gromacs PEP | 0,977 | 1.2 | 1.18 |
Grace, HBM modunda Sapphire Rapids’e karşı sekiz testten yalnızca üçünü kazandı; ancak DDR5 modunda beş testte daha iyi performans göstermeyi başardı. Grace’in %50 daha fazla çekirdeğe sahip olduğu ve Intel’in yaşlanan Intel 7 (eski adıyla 10nm) işlemi yerine TSMC’nin daha gelişmiş 4nm düğümünü kullandığı göz önüne alındığında, Nvidia için bu şaşırtıcı derecede karışık bir durum. Yine de tamamen sol alanın dışında değil: Sapphire Rapids aynı zamanda MI300X destekli Azure örneğinde AMD’nin Epyc Genoa yongalarını da yendi; bu da Sapphire Rapid’in eksikliklerine rağmen HPC için hala oldukça fazla potansiyele sahip olduğunu gösteriyor.
Öte yandan Nvidia verimlilikte ezici bir zafer elde edebilir. Grace Superchip 500 watt olarak derecelendirilmişken, Xeon Max 9468 350 watt olarak derecelendirilmiştir, bu da ikisinin TDP’sinin 700 watt olacağı anlamına gelir. Makalede her iki yonganın da güç tüketimi ayrıntıları yer almıyor ancak her yonganın kendi TDP’sinde çalıştığını varsayarsak, bu durumda karşılaştırma Nvidia için oldukça avantajlı hale geliyor.
Satır 0 – Hücre 0 | Lütuf | Safir Rapids HBM | Safir Rapids DDR5 |
Matris Çarpımı | %130,4 | %112,6 | 100% |
LINPACK | %197,6 | %129,4 | 100% |
FFT | %145,6 | %110,9 | 100% |
HPCG | %178,3 | %236,2 | 100% |
Gromacs MEM | %116,2 | %101,2 | 100% |
Gromacs kaburga | %128,1 | %97,4 | 100% |
Gromacs PEP | %115,9 | %101,7 | 100% |
Bunun gerçek güç tüketimi değil, TDP karşılaştırması olduğu göz önüne alındığında, buradaki veriler Nvidia açısından oldukça olumlu görünüyor. Görünüşe göre Grace Superchip, HBM modundaki Sapphire Rapids çipiyle karşılaştırıldığında tek bir kıyaslamada yalnızca daha az verimli. Bu, Grace’in bakış açısını kesinlikle değiştiriyor; özellikle de sunucu CPU’larının büyük dağıtımlarında verimliliğin çok önemli olduğu düşünüldüğünde; soğutma ve güç kullanım maliyetleri çok pahalı olabiliyor.
Grace, mutlak bir performans şampiyonu olmasa da günümüzün en verimli veri merkezi CPU’larından biri olma yolunda ilerliyor; ancak ne Zen 4 tabanlı Epyc CPU’ların ne de Emerald Rapids tabanlı Intel Xeon’ların bu kıyaslamalara dahil edilmediğini unutmayın. Nvidia, Grace’in verimlilik açısından AMD’nin Cenova’sını yeneceğini iddia ediyor, ancak Nvidia’nın bu konuda haklı olup olmadığını bekleyip görmemiz gerekecek.