Nvidia, yakında çıkacak Arm tabanlı Grace CPU’sunu GTC 2023’te tanıttı, ancak şirketin sistemlerin artık bu yılın ikinci yarısında piyasaya sürüleceğini açıklaması, 2023’ün ilk yarısını hedefleyen orijinal lansman zaman çizelgesinde bir gecikme olduğunu gösteriyor. Nvidia CEO’su Jensen’e sorduk. Huang’a, bugün aşağıda ele alacağımız bir basın soru-cevap oturumu sırasında yaşanan gecikme hakkında bilgi verdi. Nvidia ayrıca Grace silikonunu ilk kez gösterdi ve GTC açılış konuşması sırasında, Arm tabanlı Grace yongalarının, gücün %60’ında x86 rakiplerinden 1,3 kata kadar daha hızlı olduğu da dahil olmak üzere pek çok yeni performans iddiasında bulundu. ayrıca örtün.
Jensen Huang’a Grace CPU ve Grace Hopper Superchip sistemlerini nihai pazara teslim etmedeki gecikmeyi sordum. Beklenen çıkış tarihini şakacı bir şekilde geri ittikten sonra (bu öyleydi (yeni sekmede açılır) 1H23 (yeni sekmede açılır), şimdi 2H23 (yeni sekmede açılır)), şu cevabı verdi:
“Pekala, öncelikle size Grace ve Grace Hopper’ın üretim aşamasında olduğunu söyleyebilirim. Ve şimdi silikon fabrikada uçuyor. Sistemler yapılıyor ve biz de pek çok duyuru yaptık. Dünyanın OEM’leri ve bilgisayar üreticileri inşa ediyor onlara.”
Gördüğünüz gibi, yanıtı doğrudan gecikmeyle ilgili değil. Bugünün sevkıyat sistemlerinin tanımı belirsiz olabilir; AMD ve Intel’in ilk sistemleri genellikle, yongalar genel olarak kullanıma hazır bulunmadan çok önce dağıtım için hiper ölçekleyicilere gönderilir. Bununla birlikte Nvidia, müşterilere çipleri örneklediğini söylese de, Grace’in henüz üretime geçeceğini söylemedi. Bu nedenle, çipler şirketin tahminlerine göre geç kalıyor, ancak adil olmak gerekirse, Intel gibi şirketlerden sürekli olarak geç çip piyasaya sürülmesi alışılmadık bir durum değil. Bu, onlarca yıl boyunca yerleşik donanım ve yazılım platformlarına sahip baskın x86 yongaları etrafında inşa ederken bile yeni bir yonga piyasaya sürmenin zorluğunu vurguluyor.
Bunun aksine, Nvidia’nın Grace ve Grace+Hopper yongaları, yenilikçi yeni bir yongadan yongaya ara bağlantı ile yonga tasarımının birçok temel yönünün baştan aşağı yeniden düşünülmesidir. Nvidia’nın Arm talimat setini kullanması, yazılım optimizasyonları ve taşıma için daha ağır bir kaldırma olduğu ve şirketin inşa edilecek tamamen yeni bir platforma sahip olduğu anlamına gelir.
Jensen, uzun yanıtında bunun bir kısmına değinerek, “Yongacıklar yerine Süperçiplerle başladık çünkü yapmak istediğimiz şeyler çok büyük ve bunların ikisi de bugün üretimde. Yani müşteriler örnekleniyor, yazılım geliştiriliyor. taşınıyor ve çok fazla test yapıyoruz. Açılış konuşması sırasında birkaç sayı gösterdim ve açılış konuşmasını çok sayıda sayıyla doldurmak istemedim, ancak bir sürü sayı mevcut olacak insanların eğlenmesi için. Ama performans gerçekten çok müthişti.”
Ve Nvidia’nın iddiaları etkileyici. Örneğin, yukarıdaki albümde, Nvidia’nın ilk kez GTC’de gösterdiği Grace Hopper çipini görebilirsiniz (daha fazla teknik ayrıntıyı burada bulabilirsiniz).
Sunum sırasında Huang, çiplerin HiBench Apache Spark yoğun bellek kullanan bir kıyaslamada ‘ortalama’ yeni nesil x86 sunucu çipinden 1,2 kat daha hızlı olduğunu ve bir Google mikro hizmetler iletişim kıyaslamasında 1,3 kat daha hızlı olduğunu iddia etti; güç.
Nvidia, bunun, veri merkezlerinin her biri %25 daha yüksek verim sağlayan güç sınırlı taksitlere 1,7 kat daha fazla Grace sunucusu dağıtmasına olanak tanıdığını iddia ediyor. Şirket ayrıca iddia ediyor (yeni sekmede açılır) Grace, hesaplamalı akışkan dinamiği (CFD) iş yüklerinde 1,9 kat daha hızlıdır.
Bununla birlikte, Grace yongaları bazı iş yüklerinde ultra performanslı ve verimli olsa da, Nvidia bunları genel amaçlı sunucu pazarını hedeflemiyor. Bunun yerine şirket, çipleri, mükemmel güç verimliliğiyle birlikte üstün tek iş parçacıklı ve bellek işleme performansını destekleyen yapay zeka ve bulut iş yükleri gibi belirli kullanım durumları için uyarladı.
“[..]Huang, sorularımıza yanıt olarak, “Neredeyse her bir veri merkezi artık sınırlı güce sahip ve biz Grace’i gücün sınırlı olduğu bir ortamda olağanüstü performans gösterecek şekilde tasarladık” dedi. “Ve bu durumda, ikinizin de performansının gerçekten yüksek olması gerekir. ve gücünüz gerçekten düşük olmalı ve inanılmaz derecede verimli olmalısınız. Ve böylece Grace sistemi, en yeni nesil CPU’lara kıyasla yaklaşık iki kat daha fazla güç/performans verimliliğine sahip.”
Huang, “Ve farklı tasarım noktaları için tasarlandı, bu yüzden bu çok anlaşılır,” diye devam etti. “Örneğin, az önce anlattığım şey çoğu işletme için önemli değil. Bulut hizmeti sağlayıcıları için çok önemli ve sınırsız güçle çalışan veri merkezleri için çok önemli.”
Yakın zamanda incelediğimiz AMD EPYC Genoa gibi yongalar ve şimdi sırasıyla 400 ve 350 watt’a çıkan Intel’in Sapphire Rapids’i ile enerji verimliliği her zamankinden daha fazla endişe verici hale geliyor. Bu, standart ayarlarda olağanüstü güç çekişini ve en yüksek performans seçenekleri için sıvı soğutmayı sınırlamak için egzotik yeni hava soğutma çözümleri gerektirir.
Buna karşılık, Grace’in daha düşük güç çekişi, çiplerin soğumasını daha bağışlayıcı hale getirecektir. İlk kez GTC’de açıklandığı gibi, Nvidia’nın 144 çekirdekli Grace paketi 5″ x 8″ boyutlarındadır ve şaşırtıcı derecede kompakt olan pasif soğutmalı modüllere sığabilir. Bu modüller hala hava soğutmasına dayanmaktadır, ancak iki tanesi tek bir ince 1U kasada hava soğutmalı olabilir.
Nvidia ayrıca Grace Hopper Superchip silikonunu ilk kez GTC’de gösterdi. Superchip, Grace CPU ile Hopper GPU’yu aynı pakette birleştirir. Yukarıdaki albümde de görebileceğiniz gibi, bu modüllerden ikisi tek bir sunucu kasasına da sığabilmektedir. Bu tasarımla ilgili derin dalış ayrıntılarını buradan okuyabilirsiniz.
Bu tasarımın en büyük çıkarımı, PCIe arayüzünden yedi kat daha hızlı olan, düşük gecikmeli çipten çipe bağlantıyla beslenen gelişmiş CPU+GPU bellek tutarlılığının, CPU ve GPU’nun bellekte tutulan bilgileri paylaşmasına izin vermesidir. önceki tasarımlarla imkansız olan bir hız ve verimlilikte.
Huang, bu yaklaşımın tümü inanılmaz talep gören yapay zeka, veritabanları, öneri sistemleri ve büyük dil modelleri (LLM) için ideal olduğunu açıkladı. GPU’nun doğrudan CPU’nun belleğine erişmesine izin vererek, performansı artırmak için veri aktarımları kolaylaştırılır.
Nvidia’nın Grace yongaları programın biraz gerisinde çalışıyor olabilir, ancak şirketin tümü pazar için OEM sistemleri hazırlayan Asus, Atos, Gigabyte, HPE, Supermicro, QCT, Wiston ve Zt ile çok sayıda destekçisi var. Bu sistemlerin artık yılın ikinci yarısında çıkması bekleniyor, ancak Nvidia ikinci yarının başına mı yoksa sonuna mı geleceklerini söylemedi.