Nvidia’nın Ampere A100’ü, daha yeni Hopper H100 tarafından tahttan indirilmeden önce en iyi AI hızlandırıcılardan biriydi – H200 ve gelecek Blackwell GB200’den bahsetmeye bile gerek yok. Görünüşe göre çip üreticisi, piyasaya hiç çıkmamış gelişmiş bir versiyonu denemiş olabilir veya belki de şirketler, ABD’nin Çin’e karşı yaptırımlarının ardından A100’ü daha da hızlı hale getirmek için gizlice değiştirmiş olabilir. X kullanıcısı Jiacheng Liu yakın zamanda Çin ikinci el pazarında Nvidia’nın ‘normal’ A100’ünden çok daha yüksek özelliklere sahip çeşitli A100 prototipleri keşfetti.
Güçlendirilmiş özelliklerine rağmen A100 7936SP (7936 shader işlemcisine sahip olmasından dolayı resmi olmayan isim), normal A100 ile aynı GA100 Ampere kalıbını paylaşıyor. Bununla birlikte, ilkinde GA100 silikonundaki olası 128 SM’den (Akış Çoklu İşlemcileri) 124’ü etkinleştirilmiş durumda. Maksimum konfigürasyon olmasa da A100 7936SP, standart A100’den %15 daha fazla CUDA çekirdeğine sahiptir ve bu da önemli bir performans artışını temsil eder.
Tensör çekirdek sayıları da aynı şekilde SM sayısıyla orantılı olarak artar. Daha fazla etkinleştirilmiş SM’ye sahip olmak, A100 7936SP’nin aynı zamanda daha fazla Tensor çekirdeğine sahip olduğu anlamına gelir. Yalnızca teknik özelliklere dayalı olarak SM, CUDA ve Tensor çekirdek sayılarındaki %15’lik artış, yapay zeka performansını da benzer şekilde %15 artırabilir.
Nvidia, A100’ü 40GB ve 80GB konfigürasyonlarda sunuyor. A100 7936SP de aynı şekilde iki modelle geliyor. A100 7936SP 40GB modeli, aynı 1.410 MHz hızlandırma saatini korurken A100 80GB’den %59 daha yüksek bir temel saat hızı sergiliyor. Öte yandan A100 7936SP 96GB, normal A100’e kıyasla %18 daha hızlı bir temel saat hızı sergiliyor ve aynı zamanda altıncı HBM2 yığınının 96 GB toplam belleğe ulaşmasını sağlıyor. Ne yazık ki Çinli satıcılar GPU-Z ekran görüntüsündeki saat hızını artırmayı sansürlediler.
Nvidia A100 7936SP Özellikleri
Grafik kartı | A100 7936SP 96GB | A100 80GB | A100 7936SP 40GB | A100 40GB |
---|---|---|---|---|
Mimari | GA100 | GA100 | GA100 | GA100 |
İşlem teknolojisi | TSMC 7N | TSMC 7N | TSMC 7N | TSMC 7N |
Transistörler (Milyar) | 54.2 | 54.2 | 54.2 | 54.2 |
Kalıp boyutu (mm^2) | 826 | 826 | 826 | 54.2 |
SMS | 124 | 108 | 124 | 108 |
CUDA Çekirdekleri | 7.936 | 6.912 | 7.936 | 6.912 |
Tensör / AI Çekirdekleri | 496 | 432 | 496 | 432 |
Işın İzleme Çekirdekleri | Yok | Yok | Yok | Yok |
Temel Saat (MHz) | 1.260 | 1.065 | 1.215 | 765 |
Saati Artır (MHz) | ? | 1.410 | 1.410 | 1.410 |
TFLOPS (FP16) | >320 | 312 | 358 | 312 |
VRAM Hızı (Gbps) | 2.8 | 3 | 2.4 | 2.4 |
VRAM (GB) | 96 | 80 | 40 | 40 |
VRAM Veri Yolu Genişliği (Bit) | 6.144 | 5.120 | 5.120 | 5120 |
L2 (MB) | ? | 80 | ? | 40 |
İşleme Çıkış Birimleri | 192 | 160 | 160 | 160 |
Doku Eşleme Birimleri | 496 | 432 | 432 | 432 |
Bant genişliği (TB/s) | 2.16 | 1.94 | 1.56 | 1.56 |
TDP (watt) | ? | 300 | ? | 250 |
A100 7936SP 40GB bellek alt sistemi, A100 40GB ile aynıdır. 40 GB HBM2 bellek, beş HBM2 yığını kullanan 5120 bit bellek arayüzünde 2,4 Gbps hızında çalışır. Tasarım, 1,56 TB/s’ye kadar maksimum bellek bant genişliğine katkıda bulunur. Ancak A100 7936SP 96GB modeli burada orta sayfadır. Grafik kartı, altıncı etkin HBM2 yığını sayesinde Nvidia’nın sunduğundan %20 daha fazla HBM2 belleğe sahip. Çok büyük dil modellerinin eğitimi hafıza açısından yoğun olabilir, dolayısıyla eklenen kapasite kesinlikle yapay zeka çalışmaları için kullanışlı olacaktır.
A100 7936SP 96GB, A100 80GB ile karşılaştırıldığında yenilenmiş bir bellek alt sistemine sahip gibi görünüyor; HBM2 belleği, 3 Gbps yerine 2,8 Gbps hızında giriş yapıyor ancak farkı telafi etmeye yardımcı olmak için daha geniş bir 6144 bit bellek veriyolunda bulunuyor. Bu, A100 7936SP 96GB’nin A100 80GB’den yaklaşık %11 daha fazla bellek bant genişliğine sahip olmasıyla sonuçlanır.
A100 40GB ve 80GB sırasıyla 250W ve 300W TDP’ye sahiptir. Daha hızlı spesifikasyonlar göz önüne alındığında, A100 7936SP daha yüksek bir TDP’ye sahip olabilir. Ancak değer, paylaşılan GPU-Z ekran görüntülerinde mevcut değil. Mühendislik PCB’sinde, standart A100’ün tek 8 pinli PCIe güç konektörü yerine üç adet 8 pinli PCIe güç konektörü bulunur. Bir mühendislik prototipi olan A100 7936SP, üç güç konektörünün tümünü kullanmayabilir ancak ekstra CUDA çekirdekleri ve HBM2 belleği nedeniyle standart A100’den biraz daha fazla güç çekmesi gerekir.
Birçok Çinli satıcı A100 7936SP’yi eBay’de satıyor. 96GB modeli arasında değişir 18.000$ Ve 19.800$. Hızlandırıcıların Nvidia’nın laboratuvarından kaçan mühendislik örnekleri mi yoksa çip üreticisinin belirli bir müşteri için geliştirdiği özelleştirilmiş modeller mi olduğu bilinmiyor. Her halükarda, A100, halihazırda Çin’de bulunan kartları etkilemeyen en son ABD ihracat yaptırımlarına tabi olabilirken, bir tane almak yasal değil.
Elbette herhangi bir garanti veya resmi sürücü desteği yoktur. A100 7936SP, aynı veya potansiyel olarak daha düşük fiyata A100’den daha iyi performans sunarken, tüm yapay zeka ihtiyaçlarınız için perakende bir ürün satın almak veya bir GPU kiralamak daha güvenlidir. Ancak artık A100 GPU’ları ithal edemeyen Çin pazarı için eklenen bellek ve bilgi işlem, görünüşe göre dikkate değer.