Nvidia’nın Grace sunucu CPU’su oldukça rekabetçi görünüyor. Phoronix’in GH100 incelemesitek bir Grace çipi içerir. Nvidia’nın 72 çekirdekli Arm CPU’su genel performans açısından AMD’nin ve Intel’in amiral gemilerinin gerisinde kalsa da, kıyaslamalarda üst seviye Epyc 9754 veya Xeon Platinum 8592+’dan daha fazla kazandı. Arm mimarisi için daha fazla optimizasyonla Grace, çok güçlü bir veri merkezi işlemcisi olduğunu kanıtlayabilir.
GH100, bir Hopper GPU ve 480 GB LPDDR5X RAM’e sahip 72 çekirdekli Grace CPU içerir. Nvidia tek başına Grace çiplerini satmadığı için, GH100 (ve GH200) aslında tek bir Grace CPU’nun performansını belirlemek için test edilebilecek tek cihazdır. Phoronix, GPTshop.ai aracılığıyla GH100’e erişim elde etti, ancak bunu yalnızca uzaktan gerçekleştirdi. Uzaktaki bilgisayara hiçbir güç istatistiği sunulmadı ve yayın, duvardan elektrik çekildiğini göremediği için, incelemede hiçbir güç rakamından alıntı yapılmadı.
Karşılaştırmalar en yaygın sunucu işletim sistemi olan Linux’ta gerçekleştirildi. İnceleme, çift soketli kurulumlar da dahil olmak üzere birçok farklı CPU ile karşılaştırmalar içeriyor. Aşağıdaki tabloda Grace’i AMD’nin amiral gemisi Bergamo tabanlı Epyc 9754 ve Intel’in üst düzey Emerald Rapids Xeon Platinum 8592+ ile karşılaştıran sonuçları aldık.
Satır 0 – Hücre 0 | Grace-Hopper GH200 | Epyc 9754 | Xeon Platinum 8592+ |
Yüksek Performanslı Eşlenik Gradyan | 41.69 | 25.89 | 35.42 |
Cebirsel Çoklu Izgara Karşılaştırması 1.2 | 1.997.929.111 | 2.291.049.667 | 1.839.912.667 |
LULESH 2.0.3 | 23.185,18 | 22.356,75 | 39.468,91 |
Xmrig 6.18.1 | 17.253 | 29.356,1 | 40.381,2 |
Karındeşen John 2023.03.14 | 68.817 | 204.828 | 178.108 |
ACES DGEMM 1.0 | 17.94 | 43.68 | 29.14 |
GraphicsMagick 1.3.38 Keskinleştir | 1.363 | 924 | 749 |
GraphicsMagick 1.3.38 Geliştirme | 1.761 | 1.451 | 1.192 |
Graph500 3.0 Medyan | 1.239.790.000 | 1.147.090.000 | 1.238.670.000 |
Graph500 3.0 Maksimum | 1.315.650.000 | 1.184.510.000 | 1.304.200.000 |
Stres-NG 0.16.04 Matrisi | 512.759,08 | 552.067,04 | 301.894,53 |
Stres-NG 0.16.04 Matris 3D | 17.483,02 | 8.009,21 | 13.854,38 |
Bu testlerin tümü, GFLOP’lardan saniye başına hesaplamalara ve puanlara kadar değişen farklı değerlerde ölçüldü. Grace’in kayıplarının çoğu bu kıyaslama testlerinde yer alıyor, bu yüzden CPU ilk bakışta o kadar etkileyici görünmeyebilir. Yine de High Performance Conjugate Gradient ve GraphicsMagick gibi Grace’in büyük potansiyele sahip olduğu iş yükleri var.
Satır 0 – Hücre 0 | Grace-Hopper GH200 | Epyc 9754 | Xeon Platinum 8592+ |
Rodinia 3.1 (Daha düşük olan daha iyidir) | 30.31 | 25.15 | 39.89 |
NWChem 7.0.2 (Daha düşük olan daha iyidir) | 1.403,5 | 1.700,8 | 1.850,8 |
Xompact3d Incompact3d (Daha düşük olan daha iyidir) | 254.49 | 493.5 | 323.53 |
Xompact3d Incompact3d (Daha düşük olan daha iyidir) | 9.81 | 9.03 | 10.18 |
Godot Derlemesi 4.0 (Daha düşük olan daha iyidir) | 139.1 | 118.25 | 111.96 |
Primesieve 8.0 (Daha düşük olan daha iyidir) | 35.49 | 21.76 | 49.06 |
Helsing 1.0-beta (Daha düşük olan daha iyidir) | 67.61 | 48.95 | 84.95 |
DuckDB 0.9.1 IMDB (Daha düşük olan daha iyidir) | 92.08 | 147.6 | 96.87 |
DuckDB 0.9.1 TPC-H Parke (Alt olanı daha iyidir) | 148.76 | 177.13 | 134.73 |
RawTherapee (Daha düşük olan daha iyidir) | 46.72 | 66.13 | 45.53 |
Timed Gem 5 Derlemesi 23.0.1 (Daha düşük olan daha iyidir) | 180.62 | 208.58 | 174.18 |
Genel Ortalama Performans | 2.175,03 | 2.459,11 | 2.242,9 |
Grace, tamamlama süresinde puanlanan bu ikinci test grubunda daha fazla çaba harcıyor; burada daha düşük olan daha iyidir. Sonunda, tek Grace çipi Emerald Rapids’e karşı 15, Bergamo ve Cenova’ya karşı ise 13 galibiyet elde ediyor (bu da tabloda yer almıyor ancak sonuçlar çok benzer). Çift soketli sistemlerde Nvidia’nın sunucu CPU’sunun AMD’yi veya Intel’i geride bıraktığı bazı durumlar bile vardı. Grace ayrıca Ampere’nin Arm kullanan eskimiş Altra Max M128-30’una kıyasla çok hızlıydı.
Ancak Grace’in kayıplarının çoğu oldukça büyük olduğundan ortalama olarak Emerald Rapids destekli Xeon Platinum 8592+’nın %3 gerisinde ve Bergamo merkezli Epyc 9754 ve Cenova merkezli Epyc 9654’ten yaklaşık %13 daha yavaş. Phoronix’e göre , “hala AArch64 için çok iyi optimize edilmemiş bazı iş yükleri var [Arm]Grace kaybettiğinde genellikle büyük bir farkla kaybetmesinin temel nedeni budur.
Verimlilik de önemli bir ölçüt olduğundan Grace’in bir sunucu CPU’su olarak ne kadar iyi olacağını yalnızca performansa dayalı olarak değerlendirmek zordur. Bununla birlikte, iki Grace CPU’yu birleştiren Grace süper çipinin 500 watt’lık bir TDP’ye sahip olduğunu biliyoruz, bu da tek bir Grace’in muhtemelen 350 watt’tan fazla bir şey kullanmadığını ima ediyor. Süper çip için yapılan ilk kıyaslamalar kesinlikle çok verimli olduğunu gösteriyor ve bu muhtemelen tek çipli konfigürasyonlar için de geçerli olacak.