Nvidia, gelecek haftaki Hot Chips 34 sunumundan önce Grace CPU Superchip ile ilgili yeni detayları açıkladı ve çiplerin 4N sürecinde muhteşem olduğunu ortaya koydu. Nvidia ayrıca mimari ve veri yapısı hakkında daha fazla bilgi ile daha fazla performans ve verimlilik kıyaslaması paylaştı. Nvidia henüz Hot Chips’te resmi sunumunu yapmadı – oturumdan sonra daha ince ayrıntıları ekleyeceğiz – ancak bugün paylaşılan bilgiler, Grace yongaları ve sunucuları ilk pazarda pazara girerken bize geniş vuruşlar veriyor. 2023’ün yarısı.

Kısa bir hatırlatma olarak, Nvidia’nın Grace CPU’su, şirketin veri merkezi için tasarlanmış yalnızca CPU’ya yönelik ilk Arm yongasıdır ve tek bir anakartta toplam 144 çekirdeğe sahip iki yonga olarak gelirken, Grace Hopper Superchip, bir Hopper GPU ve Grace CPU’yu ana kartta birleştirir. aynı tahta.

En önemli açıklamalar arasında Nvidia nihayet Grace CPU’ların TSMC 4N işlemini kullandığını resmen doğruladı. TSMC 5nm düğüm ailesi altında “N4” 4nm sürecini listeler, 5nm düğümünün geliştirilmiş bir versiyonu olarak tanımlıyor. Nvidia, bu düğümün ‘4N’ olarak adlandırılan ve özellikle GPU’ları ve CPU’ları için optimize edilmiş özel bir varyantını kullanıyor.

Nvidia Grace

(İmaj kredisi: Nvidia)

Moore Yasası azaldıkça ve transistörleri küçültmek her yeni düğümle daha zor ve daha pahalı hale geldikçe, bu tür özel düğümler daha yaygın hale geliyor. Nvidia’nın 4N’si gibi özel işlem düğümlerini etkinleştirmek için çip tasarımcıları ve dökümhaneler, kendi özel ürünleri için özel güç, performans ve alan (PPA) özelliklerini aramak için Tasarım-Teknoloji Ortak Optimizasyonu (DTCO) kullanarak el ele çalışırlar.

Nvidia daha önce Grace CPU’ları için hazır Arm Neoverse çekirdeklerini kullandığını açıklamıştı, ancak şirket hala hangi sürümü kullandığını belirtmedi. Ancak Nvidia, Grace’in Arm v9 çekirdeklerini kullandığını ve SVE2’yi desteklediğini ve Neoverse N2 platformunun Arm’ın Arm v9 ve SVE2 gibi uzantıları destekleyen ilk IP’si olduğunu açıkladı. N2 Perseus platformu 5nm tasarım olarak gelir (unutmayın, N4, TSMC’nin 5nm ailesindedir) ve PCIe Gen 5.0, DDR5, HBM3, CCIX 2.0 ve CXL 2.0’ı destekler. Perseus tasarımı, güç başına performans (watt) ve alan başına performans için optimize edilmiştir. Arm, yeni nesil çekirdekleri Poseidon’un 2024’e kadar piyasaya çıkmayacağını ve bu çekirdeklerin Grace’in 2023’ün başlarında piyasaya sürülme tarihi göz önüne alındığında daha az olası bir aday olduğunu söylüyor.

Nvidia Grace Hopper CPU Mimarisi

Nvidia’nın yeni Nvidia Ölçeklenebilir Tutarlılık Yapısı (SCF), Arm Neoverse çekirdekleriyle kullanılan standart CMN-700 Tutarlı Örgü Ağı’na çok benzeyen bir ağ bağlantısıdır.

Nvidia SCF, CPU çekirdekleri, bellek ve G/Ç gibi çeşitli Grace yonga birimleri arasında 3,2 TB/sn iki kesitli bant genişliği sağlar ve yongayı diğer birime bağlayan NVLink-C2C arabiriminden bahsetmiyorum bile. anakart, başka bir Grace CPU veya Hopper GPU olsun.

Grace CPU'su

(İmaj kredisi: Nvidia)

Ağ, 72+ çekirdeği destekler ve her CPU’da toplam 117 MB L3 önbellek bulunur. Nvidia, yukarıdaki albümdeki ilk blok diyagramın ‘açıklayıcı amaçlar için olası bir topoloji’ olduğunu ve hizalamanın ikinci diyagramla tamamen uyuşmadığını söylüyor.

Bu şemada, L3 önbellek dilimleri gibi görünen sekiz SCF Önbellek bölümü (SCC) ile birlikte sekiz CPU birimi (bunlar çekirdek kümeleri gibi görünüyor) ile çip gösterilmektedir (daha fazla ayrıntıyı sunuda öğreneceğiz). SCC ve çekirdekler, iki kişilik gruplar halinde Önbellek Anahtar Düğümlerine (CSN) bağlanır, ardından CSN, CPU çekirdekleri ile çipin geri kalanına bellek arasında bir arabirim sağlamak için SCF ağ dokusunda bulunur. SCF ayrıca Coherent NVLink ile dört yuvaya kadar tutarlılığı destekler.

Grace CPU'su

(İmaj kredisi: Nvidia)

Nvidia ayrıca her Grace CPU’nun 68 adede kadar PCIe hattını ve dört adede kadar PCIe 5.0 x16 bağlantısını desteklediğini gösteren bu diyagramı paylaştı. Her x16 bağlantısı 128 GB/s’ye kadar çift yönlü çıktıyı destekler (x16 bağlantıları iki x8 bağlantısına bölünebilir). Ayrıca 16 adet çift kanallı LPDDR5X bellek denetleyicisi (MC) görüyoruz.

Bununla birlikte, bu şema ilkinden farklıdır – L3 önbelleğini dört çekirdekli CPU kümelerine bağlı iki bitişik blok olarak gösterir; bu, önceki şemadan çok daha anlamlıdır ve çipte toplam 72 çekirdeğe sahiptir. Ancak, ilk diyagramda ayrı SCF bölümlerini veya CSN düğümlerini görmüyoruz, bu da biraz karışıklığa neden oluyor. Bunu sunum sırasında değerlendireceğiz ve gerektiğinde güncelleyeceğiz.

Nvidia, Ölçeklenebilir Tutarlılık Yapısının (SCF) tescilli tasarımı olduğunu söylüyor, ancak Arm, ortaklarının çekirdek sayılarını, önbellek boyutlarını ayarlayarak ve DDR5 ve HBM gibi farklı bellek türlerini kullanarak CMN-700 ağını özelleştirmesine izin veriyor ve PCIe 5.0, CXL ve CCIX gibi çeşitli arayüzleri seçme. Bu, Nvidia’nın kalıp üstü kumaş için son derece özelleştirilmiş bir CMN-700 uygulaması kullanmasının mümkün olduğu anlamına gelir.

Nvidia Grace Hopper Genişletilmiş GPU Belleği



genel-21