Nvidia CEO’su Jensen Huang, GTC 2022’de, şirketin veri merkezi için tasarlanan ilk yalnızca CPU’ya özel Arm çipi olan yeni 144 çekirdekli Grace CPU Superchip’i tanıtırken nihayet şirketin Arm çabaları hakkında daha fazla ayrıntı paylaştı. Neoverse tabanlı sistem, Nvidia’nın yeni markalı NVLink-C2C ara bağlantı teknolojisi ile kaynaşmış iki CPU olarak geliyor. Nvidia, Grace CPU Superchip’in bir SPEC karşılaştırmasında, kendi DGX A100 sunucularında kullandığı son nesil 64 çekirdekli AMD EPYC işlemcilerinden ikisine göre 1.5 kat daha fazla performans ve günümüzün önde gelen sunucu yongalarının iki katı güç verimliliği sunduğunu iddia ediyor. Genel olarak Nvidia, Grace CPU Superchip’in hiper ölçekli hesaplama, veri analitiği ve bilimsel hesaplama gibi çok çeşitli uygulamalar için 2023’ün başlarında piyasaya çıktığında piyasadaki en hızlı işlemci olacağını iddia ediyor.
Arm’ın yol haritası hakkında bildiklerimiz göz önüne alındığında, Hopper CPU Superchip, Arm v9’u ilk destekleyen N2 Perseus platformuna dayanıyor ve PCIe Gen 5.0, DDR5, HBM3 gibi en son bağlantı teknolojilerinin tümünü destekleyen 5 nm bir tasarım olarak geliyor. , CCIX 2.0 ve CXL 2.0, V1 platformuna göre %40’a kadar daha fazla performans sunar.
Ek olarak Nvidia, daha önce duyurulan CPU+GPU yongası Grace Hopper Superchip hakkında yeni ayrıntılar paylaştı. Nvidia ayrıca bellek tutarlılığını destekleyen bir kalıptan uca ve yongadan yongaya ara bağlantı olan yeni NVLink-C2C arabirimini duyurdu. NVLink-C2C 25 kata kadar daha fazla enerji verimliliği sağlayabilir ve Nvidia’nın şu anda kullandığı PCIe 5.0 PHY’lerden 90 kat daha fazla alan verimlidir, 900 GB/sn veya daha yüksek çıktıyı destekler. Bu arabirim, CXL ve Arm’ın AMBA CHI’si gibi endüstri standardı protokolleri destekler ve PCB tabanlı ara bağlantılardan silikon aracılara ve gofret ölçekli uygulamalara kadar her türlü bağlantıyı destekler. Ayrıca Nvidia, yeni UCIe spesifikasyonunu destekleyeceğini duyurdu. Ayrıntılara girelim.
Nvidia Grace CPU Süper Çipi
Yeni Grace CPU Superchip’e geçmeden önce, ilk örneğini hızlı bir şekilde tazelemeniz gerekecek: Nvidia, ilk olarak Grace CPU adını verdiği şeyi geçen yıl duyurdu, ancak şirket çok fazla ince ayrıntı paylaşmadı. Nvidia, bu ilk girişimin adını şimdi Grace Hopper Superchip olarak değiştirdi.
Grace Hopper Superchip, bir taşıyıcı kart üzerinde bir CPU ve bir GPU olmak üzere iki farklı çipe sahiptir. Artık CPU’nun 72 çekirdeğe sahip olduğunu, Arm v9’u destekleyen Neoverse tabanlı bir tasarım kullandığını ve bir Hopper GPU ile eşleştirildiğini biliyoruz. Bu iki birim, CPU ve GPU arasında bellek tutarlılığı sağlayan 900 GBps’lik bir NVLink-C2C bağlantısı üzerinden iletişim kurar; bunlar, standart sistemlere göre 30 kat daha fazla bant genişliği geliştirmesi talep edilen LPDDR5X ECC bellek havuzuna aynı anda erişim sağlar.
Nvidia başlangıçta tasarım için kullandığı LPDDR5X miktarını açıklamadı, ancak burada şirketin artık LPDDR5X bellek havuzunu içeren bir ‘600GB Bellek GPU’su talep ettiğini görebiliriz. LPDDR5X’in paket başına 64 GB olduğunu biliyoruz. Grace Hopper Superchip’in altında LPDDR5X paketi olmadığını varsayarsak, bu, 512 GB’a kadar LPDDR5X’e sahip modelleri görebileceğimiz anlamına gelir. Bu arada, Hopper GPU tipik olarak 80GB HBM3 kapasitesi ile geliyor ve bu da bizi Nvidia’nın 600GB rakamına yaklaştırıyor.
Bugünkü duyuru, Grace Hopper CPU+GPU tasarımına dayanan ancak Hooper GPU yerine ikinci bir CPU paketine sahip Grace CPU Superchip’i kapsıyor. Bu iki 72 çekirdekli yonga aynı zamanda NVLink-C2C bağlantısı aracılığıyla birbirine bağlanarak, onları tek bir 144 çekirdekli birime birleştiren tutarlı bir 900 GB/sn bağlantı sağlar. Arm v9 Neoverse tabanlı çip, AVX’e benzer şekilde çalışan SIMD talimatları olan Arm’ın Ölçeklenebilir Vektör Uzantılarını (SVE) destekler.
Grace CPU Superchip, çipin Neoverse N2 tasarımını kullandığını söyleyen Arm v9’u kullanır, burada daha ayrıntılı olarak okuyabilirsiniz. Neoverse N2 platformu, Arm’ın SVE2 ve Memory Tagging gibi yeni duyurulan Arm v9 uzantılarını destekleyen ilk IP’sidir ve V1 platformuna göre %40’a kadar daha fazla performans sunar. N2 Perseus platformu, PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 ve CXL 2.0’ı destekleyen 5nm bir tasarım olarak gelir. Perseus, güç başına performans (watt) ve alan başına performans için optimize edilmiştir.
Grace CPU Superchip’in hem iki CPU hem de yerleşik bellek için 500W’lık bir tepe tükettiği göz önüne alındığında, bu çok mantıklı. Nvidia, bunun pazara geldiğinde rakip CPU’lardan iki kat daha verimli olacağını iddia ediyor.
Her CPU’nun kendi sekiz LPDDR5X paketine erişimi olduğu göz önüne alındığında, iki yonga, standart NUMA benzeri yakın ve uzak bellek eğilimlerinden etkilenmeye devam edecek, ancak iki yonga arasındaki artan bant genişliği, daha az çekişme nedeniyle gecikmeyi azaltmaya da yardımcı olacaktır. , böylece çok verimli bir çok çipli uygulama sağlar. Cihaz ayrıca 396MB çip üzerinde önbellek ile birlikte geliyor, ancak bunun tek bir çip için mi yoksa her ikisi için mi olduğu belli değil.
Grace CPU Superchip bellek alt sistemi, Nvidia’nın söylediğine göre CPU’lar için bir ilk ve diğer modern veri merkezi işlemcilerinin iki katından fazla (bu, doğru olarak adlandırılacak kadar yakın) 1 TB/s’ye kadar bant genişliği sağlar. 16 görünür paketle, bu, LPDDR5X için teorik maksimum kapasiteyi 1024 GB’a yerleştirir, ancak görünür taşıyıcının altında gizli paketler olması ve ECC desteğinin kullanılabilir kapasiteyi çiğneme olasılığı vardır. Nvidia ayrıca Grace’in LPDDR5X’in ilk ECC uygulamasını kullandığını belirtiyor.
Bu da bizi kriterlere getiriyor. Nvidia, Grace CPU Superchip’in SPECrate_2017_int_base testinde DGX A100 sistemlerinde kullandığı önceki iki 64 çekirdekli EPYC Rome 7742 işlemciden 1,5 kat daha hızlı olduğunu iddia ediyor. Nvidia bu iddiayı, Grace CPU’yu 740 puanda öngören bir silikon öncesi simülasyona dayandırdı. Veri merkezindeki mevcut performans lideri olan AMD’nin mevcut nesil EPYC Milan yongaları, 382 ile 424 arasında değişen SPEC sonuçları yayınladı ve Grace CPU Superchip, daha yeni modellerde bile oldukça belirgin bir lider.
Nvidia, artık hiper ölçekli bilgi işlem, bulut, veri analitiği, HPC ve AI iş yüklerini kapsayan Grace CPU Superchip ile hedef pazarlarını genişletiyor ve bu da genel amaçlı sunucu pazarını etkili bir şekilde hedeflediği anlamına geliyor. Grace CPU Superchip, Nvidia’nın tüm CUDA yığınını destekler ve Nvidia’nın tüm uygulamalarını çalıştırır.
Nvidia, yakından takip edeceğimiz mimari hakkında daha ayrıntılı ayrıntılar sağlayan bir teknik incelemenin geleceğini söylüyor.
Bu son dakika haberi… devamı gelecek.