Nvidia’nın Ampere A100’ü, daha yeni Hopper H100 tarafından tahttan indirilmeden önce en iyi AI hızlandırıcılardan biriydi – H200 ve gelecek Blackwell GB200’den bahsetmeye bile gerek yok. Görünüşe göre çip üreticisi, piyasaya hiç çıkmamış gelişmiş bir versiyonu denemiş olabilir veya belki de şirketler, ABD’nin Çin’e karşı yaptırımlarının ardından A100’ü daha da hızlı hale getirmek için gizlice değiştirmiş olabilir. X kullanıcısı Jiacheng Liu yakın zamanda Çin ikinci el pazarında Nvidia’nın ‘normal’ A100’ünden çok daha yüksek özelliklere sahip çeşitli A100 prototipleri keşfetti.

Güçlendirilmiş özelliklerine rağmen A100 7936SP (7936 shader işlemcisine sahip olmasından dolayı resmi olmayan isim), normal A100 ile aynı GA100 Ampere kalıbını paylaşıyor. Bununla birlikte, ilkinde GA100 silikonundaki olası 128 SM’den (Akış Çoklu İşlemcileri) 124’ü etkinleştirilmiş durumda. Maksimum konfigürasyon olmasa da A100 7936SP, standart A100’den %15 daha fazla CUDA çekirdeğine sahiptir ve bu da önemli bir performans artışını temsil eder.

Tensör çekirdek sayıları da aynı şekilde SM sayısıyla orantılı olarak artar. Daha fazla etkinleştirilmiş SM’ye sahip olmak, A100 7936SP’nin aynı zamanda daha fazla Tensor çekirdeğine sahip olduğu anlamına gelir. Yalnızca teknik özelliklere dayalı olarak SM, CUDA ve Tensor çekirdek sayılarındaki %15’lik artış, yapay zeka performansını da benzer şekilde %15 artırabilir.

Nvidia, A100’ü 40GB ve 80GB konfigürasyonlarda sunuyor. A100 7936SP de aynı şekilde iki modelle geliyor. A100 7936SP 40GB modeli, aynı 1.410 MHz hızlandırma saatini korurken A100 80GB’den %59 daha yüksek bir temel saat hızı sergiliyor. Öte yandan A100 7936SP 96GB, normal A100’e kıyasla %18 daha hızlı bir temel saat hızı sergiliyor ve aynı zamanda altıncı HBM2 yığınının 96 GB toplam belleğe ulaşmasını sağlıyor. Ne yazık ki Çinli satıcılar GPU-Z ekran görüntüsündeki saat hızını artırmayı sansürlediler.

Nvidia A100 7936SP Özellikleri

Yatay kaydırmak için kaydırın
Grafik kartı A100 7936SP 96GB A100 80GB A100 7936SP 40GB A100 40GB
Mimari GA100 GA100 GA100 GA100
İşlem teknolojisi TSMC 7N TSMC 7N TSMC 7N TSMC 7N
Transistörler (Milyar) 54.2 54.2 54.2 54.2
Kalıp boyutu (mm^2) 826 826 826 54.2
SMS 124 108 124 108
CUDA Çekirdekleri 7.936 6.912 7.936 6.912
Tensör / AI Çekirdekleri 496 432 496 432
Işın İzleme Çekirdekleri Yok Yok Yok Yok
Temel Saat (MHz) 1.260 1.065 1.215 765
Saati Artır (MHz) ? 1.410 1.410 1.410
TFLOPS (FP16) >320 312 358 312
VRAM Hızı (Gbps) 2.8 3 2.4 2.4
VRAM (GB) 96 80 40 40
VRAM Veri Yolu Genişliği (Bit) 6.144 5.120 5.120 5120
L2 (MB) ? 80 ? 40
İşleme Çıkış Birimleri 192 160 160 160
Doku Eşleme Birimleri 496 432 432 432
Bant genişliği (TB/s) 2.16 1.94 1.56 1.56
TDP (watt) ? 300 ? 250

A100 7936SP 40GB bellek alt sistemi, A100 40GB ile aynıdır. 40 GB HBM2 bellek, beş HBM2 yığını kullanan 5120 bit bellek arayüzünde 2,4 Gbps hızında çalışır. Tasarım, 1,56 TB/s’ye kadar maksimum bellek bant genişliğine katkıda bulunur. Ancak A100 7936SP 96GB modeli burada orta sayfadır. Grafik kartı, altıncı etkin HBM2 yığını sayesinde Nvidia’nın sunduğundan %20 daha fazla HBM2 belleğe sahip. Çok büyük dil modellerinin eğitimi hafıza açısından yoğun olabilir, dolayısıyla eklenen kapasite kesinlikle yapay zeka çalışmaları için kullanışlı olacaktır.

A100 7936SP 96GB, A100 80GB ile karşılaştırıldığında yenilenmiş bir bellek alt sistemine sahip gibi görünüyor; HBM2 belleği, 3 Gbps yerine 2,8 Gbps hızında giriş yapıyor ancak farkı telafi etmeye yardımcı olmak için daha geniş bir 6144 bit bellek veriyolunda bulunuyor. Bu, A100 7936SP 96GB’nin A100 80GB’den yaklaşık %11 daha fazla bellek bant genişliğine sahip olmasıyla sonuçlanır.



genel-21