Nvidia, yapay zeka (AI) ve yüksek performanslı bilgi işlem (HPC) uygulamaları için Çin pazarına yönelik ve ABD ihracat gerekliliklerine uyacak üç yeni GPU hazırlıyor. ChinaStarMarket.cn. Sızan bilgilere göre yeni birimler Ada Lovelace ve Hopper mimarilerini temel alacak.
Raporda, söz konusu AI ve HPC ürünlerinin HGX H20, L20 PCle ve L2 PCle GPU’lar olduğu ve hepsinin halihazırda Çinli sunucu üreticilerine gittiği iddia ediliyor. Bu sırada, HKEPC 96 GB HBM3 belleğe sahip yeni HGX H20’nin Hopper mimarisini temel aldığını ve ciddi şekilde sakatlanmış amiral gemisi H100 silikonunu veya yeni Hopper tabanlı yapay zeka ve HPC GPU tasarımını kullandığını iddia eden bir slayt yayınladı. Bu resmi olmayan bir bilgi olduğundan, buna biraz şüpheyle yaklaşın.
hükümsüz | HGX H20 | L20 PCle | L2 PCle |
Mimari | Hazne | Ada Lovelace | Ada Lovelace |
Hafıza | 96 GB HBM3 | 48 GB GDDR6, ECC’li | 24 GB GDDR6, ECC’li |
Bellek Bant Genişliği | 4,0 TB/sn | 864 GB/sn | 300 GB/sn |
INT8 I FP8 Tensörü | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS |
BF16 I FP16 Tensör | 148 I 148 TFLOPS | 119,5 I 119,5 TFLOPS | 96,5 ve 96,5 TFLOPS |
TF32 Tensör | 74 TFLOP | 59,8 TFLOP | 48.3 TFLOP |
FP32 | 44 TFLOP | 59,8 TFLOP | 24.1 TFLOPS |
FP64 | 1 TFLOP | Yok | Yok |
RT Çekirdeği | Yok | Evet | Evet |
MIG | 7 MIG’ye kadar | Yok | Yok |
L2 Önbellek | 60MB | 96 MB | 36MB |
Medya Motoru | 7 NVDEC, 7 NVJPEG | 3 NVENC (+AV1), 3 NVDEC, 4 NVJPEG | 2 NVENC (AVI), 4 NVDEC, 4 NVJPEG |
Güç | 400W | 275W | henüz bilinmiyor |
Form faktörü | 8 yollu HGX | 2 yuvalı FHFL | 1 yuvalı LP |
Arayüz | PCIe Gen5 x16: 128 GB/sn | PCle Gen4 x16: 64 GB/sn | PCle Gen4 x16: 64 GB/sn |
NVLink | 900 GB/sn | – | – |
Örnekler | Kasım 2023 | Kasım 2023 | Kasım 2023 |
Üretme | Aralık 2023 | Aralık 2023 | Aralık 2023 |
Performans söz konusu olduğunda HGX H20, HPC için 1 FP64 TFLOPS (H100’de 34 TFLOPS’a karşılık) ve 148 FP16/BF16 TFLOPS (H100’de 1.979 TFLOPS’a karşılık) sunar. Nvidia’nın amiral gemisi hesaplama GPU’sunun kesilip indirimli olarak satılamayacak kadar pahalı olduğunu belirtmek gerekir, ancak Nvidia’nın bu noktada başka seçeneği olamaz. Şirket halihazırda Ampere mimarisini temel alan 24 GB HBM2’ye sahip daha düşük seviye bir A30 AI ve HPC GPU’ya sahip ve A100’den daha ucuz. Aslında A30, hem FP64 hem de FP16/BF16 formatlarında HGX H20’den daha hızlıdır.
L20 ve L2 PCIe AI ve HPC GPU’lara gelince, bunlar Nvidia’nın küçültülmüş AD102 ve AD104 GPU’larını temel alacak gibi görünüyor ve L40 ve L40S ürünleriyle aynı pazarlara hitap edecek.
Son birkaç yılda ABD, Çin’e yüksek performanslı donanım ihracatına katı kısıtlamalar getirdi. ABD’nin Çin süper bilgisayar sektörüne yönelik Ekim 2022’de uyguladığı kısıtlamalar, Çinli kuruluşların 41.600 fit küp (1.178 metreküp) içinde 100 FP64 PetaFLOPS’un üzerinde performansa sahip süper bilgisayarlar kurmasını engellemeye odaklanıyor. ABD ihracat kurallarına uymak amacıyla Nvidia, A800 ve H800 GPU’ları için GPU’lar arası bağlantıyı ve GPU işleme performansını kesmek zorunda kaldı.
Kasım 2023’te belirlenen sınırlamalar, parçanın diğer işlemcilere (Nvidia’nın durumunda NVLink kullanarak) verimli bir şekilde bağlanıp bağlanamadığına bakılmaksızın, belirli bir toplam işlem performansına ve/veya performans yoğunluğuna ulaşan tüm donanımlar için ihracat lisansları gerektirir. Sonuç olarak Nvidia artık A100, A800, H100, H800, L40, L40S ve GeForce RTX 4090’ı ABD hükümetinden ihracat lisansı olmadan Çinli kuruluşlara satamayacak. Yeni kurallara uyum sağlamak amacıyla, AI ve HPC bilgi işlem için HGX H20, L20 PCle ve L2 PCle GPU’lar yalnızca sakat NVLink bağlantısıyla değil, aynı zamanda sakat performansla da gelecek.
İlginç bir şekilde, ancak yakın zamanda Nvidia, A800 ve H800 AI ve HPC GPU’larını ABD’de resmi olarak küçük ölçekli kurumsal AI dağıtımlarını ve iş istasyonlarını hedef alarak piyasaya sürdü. Şirketin artık bu birimleri Çin, Suudi Arabistan, Birleşik Arap Emirlikleri ve Vietnam’daki şirketlere satamayacağını akılda tutarsak, bu, büyük bulut hizmeti sağlayıcıları için pek ilgi çekici olmayacak envanterden kurtulmanın iyi bir yoludur. ABD ve Avrupa.