Nvidia, GTC’de veri merkezi için tasarlanan ilk yalnızca CPU Arm çipi olan yeni 144 çekirdekli Grace CPU Superchip’i tanıttı. Nvidia, 1.5 kat önde olmak için AMD’nin EPYC’sine karşı bir kıyaslama paylaştı, ancak bu çok yararlı bir karşılaştırma değil. Ancak, Nvidia’nın Hızlandırılmış Bilgi İşlem iş biriminin başkan yardımcısı Ian Buck’ın GTC sunumunda gömülü Intel’in Buz Gölü’ne karşı Grace’in bir kıyaslamasını bulduk. Bu kıyaslama, Grace’in HPC’de yaygın olarak kullanılan Hava Durumu Araştırma ve Tahmin (WRF) modelinde Intel’in mevcut nesil Buz Gölü’nden 2 kat daha hızlı ve 2.3 kat daha enerji verimli olduğunu iddia ediyor.
Nvidia’nın ilk karşılaştırması, Grace’in SPECrate_2017 karşılaştırmasında önceki iki 64 çekirdekli EPYC Rome 7742 işlemciden 1,5 kat daha hızlı olduğunu ve 2023’ün başlarında geldiğinde günümüzün sunucu yongalarının iki katı güç verimliliği sağlayacağını iddia etti. önceki nesil yongalarla karşılaştırın — Grace gelecek yıl geldiğinde Roma yongaları dört yaşında olacak ve AMD şimdiden daha hızlı EPYC Milan sevkiyatına sahip. Roma ile kıyaslandığında, Nvidia’nın Grace’inin hem performans hem de watt başına performans açısından yeni Milan ile aynı seviyede olmasını bekleyebiliriz. Ancak, bu karşılaştırma bile gerçekten önemli değil; AMD’nin EPYC Genoa’sı 2023’te piyasaya çıkacak ve daha da hızlı olacak.
Bu, Nvidia’nın Intel’in mevcut nesil Buz Gölü ile karşılaştırmasını biraz daha ilginç hale getiriyor. Bu nedenle, Intel 2023 yılına kadar Sapphire Rapids’i sunacak olsa da, en azından aşağıdaki karşılaştırmada bir nesil daha yakın hale geliyoruz. Doğal olarak, bu satıcı tarafından sağlanan bir kıyaslama sonucu ve Grace CPU’nun bir simülasyonuna dayanıyor, bu nedenle Nvidia’nın iddialarını bir miktar tuzla alın.
Hatırlatmak gerekirse, Nvidia’nın Grace CPU Superchip’i, Nvidia’nın 900 GB/sn verim ve bellek tutarlılığı sunan yeni markalı NVLink-C2C ara bağlantı teknolojisi ile kaynaşmış iki kalıp üzerine yayılmış 144 çekirdeğe sahip bir Arm v9 Neoverse (N2 Perseus) işlemcisidir. Ayrıca çip, 1 TB/sn’ye kadar bellek bant genişliği sağlayan 1 TB LPDDR5x ECC bellek kullanır; bu, DDR5 belleği destekleyecek diğer veri merkezi işlemcilerinin iki katıdır.
Ve hiç şüpheniz olmasın, bu gelişmiş bellek çıkışı, yukarıdaki Hava Araştırması ve Tahmini (WRF) modelinde Grace CPU Superchip’in güçlü yönlerine tam olarak uyuyor. Nvidia, 144 çekirdekli Grace çipinin simülasyonlarının, WRF simülasyonunda 2 kat daha hızlı olacağını ve iki adet 36 çekirdekli 72 iş parçacıklı Intel ‘Ice Lake’ Xeon Platinum 8360Y işlemcinin 2.3 kat güç verimliliğini sağlayacağını gösterdiğini söylüyor. Bu, 144 hiper iş parçacıklı x86 iş parçacığı (fiziksel çekirdek başına iki iş parçacığı) ile karşı karşıya olan 144 Kol iş parçacığı (her biri bir fiziksel çekirdek üzerinde) gördüğümüz anlamına gelir.
WRF’nin çeşitli permütasyonları, kıyaslama için yaygın olarak kullanılan gerçek dünya iş yükleridir ve modüllerin çoğu, CUDA ile GPU hızlandırması için aktarılmıştır. Bu özel kıyaslama hakkında Nvidia ile görüştük ve şirket bu modülün henüz GPU’lara taşınmadığını, dolayısıyla CPU merkezli olduğunu söylüyor. Ek olarak, bellek bant genişliğine karşı çok hassastır ve Grace’e hem performans hem de verimlilik açısından bir adım öndedir. Nvidia’nın tahminleri “IB4 modeli için Arm’a aktarılan standart NCAR WRF, sürüm 3.9.1.1’e dayanmaktadır (İber yarımadasının 4 km’lik bir bölgesel tahmini).”
Grace’in muazzam bellek çıktısı, performansta ve ayrıca enerji verimliliğinde temettü ödeyecek çünkü artan çıktı, açgözlü çekirdekleri verilerle besleyerek etkin olmayan döngülerin sayısını azaltır. Çipler ayrıca Ice Lake’in DDR4’üne kıyasla daha düşük güçlü LPDDR5X kullanıyor.
Bununla birlikte, Grace muhtemelen Intel’in yakında çıkacak olan Sapphire Rapids’ine karşı bir avantaja sahip olmayacak – bu yongalar DDR5 belleği destekliyor ve ayrıca Grace’in bellek bant genişliği sıkıntısı çeken bazı uygulamalarda gücüne karşı koymaya yardımcı olabilecek HBM bellekli varyantları var. AMD ayrıca, bazı iş yüklerine fayda sağlayan 3D yığınlanmış L3 önbelleğe (3D V-Cache) sahip Milan-X’e sahiptir ve şirketin EPYC Genoa ailesi için benzer SKU’lar yapmasını bekliyoruz.
Nvidia’nın, Intel’in şu anki nesli Buz Gölü üzerindeki 2 kat daha büyük kazancını kullanmak yerine, GTC’de ve basın bültenlerinde manşet kıyaslama karşılaştırmaları için AMD’nin önceki nesil EPYC Roma’sına göre 1.5 kat kazanç gösteren kıyaslama ölçütleri kullandığını söylüyor. Bunun yerine, Intel karşılaştırmasını bir GTC sunumuna gömdü. AMD’nin veri merkezinde lider olduğu göz önüne alındığında, Nvidia belki de önceki nesil yongalarını yenmeyi başarmanın bile Intel’in mevcut neslinin en iyilerini devirmekten daha etkileyici olduğunu hissetti.
Her iki durumda da bu, Nvidia’nın Intel’in silikonunu kullanmadığı anlamına gelmiyor. Örneğin, Nvidia’dan Jensen Huang, yakın tarihli bir yuvarlak masa toplantısında bize şunları söyledi: “[…]Yakında çıkacak olan Omniverse bilgisayarlarımızda Intel’in CPU’ları olmasaydı, gerçekten iyi oldukları tek iş parçacıklı performansa bu kadar derinden dayanan dijital ikiz simülasyonları yapamazdık.“
Aslında, bu Nvidia OVX sunucuları, her biri Intel’in 32 çekirdekli Ice Lake 8362 işlemcilerinden ikisini kullanıyor ve en azından bu özel kullanım durumu için, tek iş parçacıklı çalışmada AMD’nin EPYC’sinden daha çevik oldukları için açıkça seçildiler. İlginç bir şekilde, Nvidia, Grace’in tek iş parçacıklı çalışmadaki kahramanlığına ilişkin herhangi bir projeksiyonu henüz paylaşmadı, bunun yerine şimdilik saf dişli ağırlığını göstermeyi tercih etti.
Veri merkezi CPU yarışına yeni ve çok ciddi bir rakip girerken, ileride kesinlikle ilginç zamanlar olacak, bu sefer veri merkezindeki en önemli sayı kırıcı olan GPU ile sıkı bir şekilde entegre olan özel bir Kol tasarımı ile. .
Genel olarak Nvidia, Grace CPU Superchip’in hiper ölçekli hesaplama, veri analitiği ve bilimsel hesaplama gibi çok çeşitli uygulamalar için 2023’ün başlarında piyasaya çıktığında piyasadaki en hızlı işlemci olacağını iddia ediyor. Nvidia’nın Grace CPU Superchip’inin 2023’teki diğer veri merkezi yongalarına göre ne kadar iyi performans gösterdiğine bakılmaksızın, özellikle aşağıda gösterilen ve halihazırda Arm’da çalışan sayısız HPC iş yükü için, önümüzdeki yıllarda kesinlikle çok sayıda seçenek olacaktır. Veri merkezindeki yeni Arm tabanlı çiplerin son zamanlardaki patlaması göz önüne alındığında, bu listenin hızla büyümesini bekliyoruz.