Tesla, kendi AI süper bilgisayarını binlerce ek Nvidia A100 GPU ile güçlendirdi. Tesla süper bilgisayarında yaklaşık bir yıl önce 5.760 A100 GPU vardı ve bu sayı o zamandan beri 7.360 A100 GPU’ya yükseldi – bu, ek 1.600 GPU veya yaklaşık %28’lik bir artış.
Tesla Mühendislik Müdürü Tim Zaman’a göre, bu yükseltme firmanın AI sistemini GPU sayısına göre dünya çapında ilk 7 süper bilgisayar yapıyor.
Nvidia A100 GPU, veri merkezlerini hedefleyen güçlü bir Ampere mimarisi çözümüdür. Evet, şu anda mevcut olan en iyi grafik kartlarından bazıları olan GeForce RTX 30 serisi GPU’larla aynı GPU mimarisini kullanır. Ancak 80 GB HBM2e dahili bellekle gelen, 2 TB/s’ye kadar bant genişliği sunan ve 400 W’a kadar güç gerektiren A100 ile yakın bir tüketici ilişkisi yok. A100’ün mimarisi ayrıca yapay zeka, veri analitiği ve yüksek performanslı bilgi işlem (HPC) uygulamalarında yaygın olan görevleri hızlandırmak için ayarlandı.
Nvidia’nın A100’ü kullandığını gösterdiği ilk sistem, 10 PetaOPS INT8 performansı, 5 PFLOPS FP16, 2,5 TFLOPS TF32 için 4,8 TBps çift yönlü bant genişliği ile altı NVSwitch aracılığıyla bağlantılı sekiz A100 GPU’da paketlenmiş Nvidia DGX A100 idi. ve tek bir düğümde 156 TFLOPS FP64.
Bu sekiz A100 GPU’ydu – Tesla’nın AI süper bilgisayarında artık bunlardan 7.360 tane var. Tesla, AI süper bilgisayarını kamuya açık bir şekilde karşılaştırmadı, ancak 6.144 Nvidia A100 GPU’ya sahip benzer şekilde donatılmış GPU tabanlı NERSC Perlmutter, 70.87 Linpack petaflops elde ediyor. Bunu ve diğer A100 GPU süper bilgisayarlarından gelen verileri performans referans noktaları olarak kullanarak, HPC Teli Tesla AI süper bilgisayarının yaklaşık 100 Linpack petaflop elde edebileceğini tahmin ediyor.
Tesla, şirket içi AI süper bilgisayarları için uzun vadede Nvidia GPU mimarisi yolunda devam etmeyi düşünmüyor. GPU sayımına göre bu dünyanın en iyi 7 makinesi, yalnızca yaklaşmakta olan makinenin habercisidir. dojo ilk olan süper bilgisayar ilan edildi Elon Musk tarafından 2020’de yayınlandı. Bir yıl önce, “her ayrıntı düzeyinde maksimum performans, verim ve bant genişliği” için Nvidia’nın GPU’larının yerini almak üzere tasarlanan Tesla D1 Dojo çipine bir göz atmıştık.
Tesla Dojo D1, AI eğitimine yönelik özel bir ASIC (uygulamaya özel entegre devre) tasarımıdır ve bu alandaki ilk ASIC’lerden biridir. Mevcut D1 test çipleri, TSMC N7’de üretilir ve yaklaşık 50 milyon transistörde paketlenir.
Dojo D1 çipi ve Dojo sistemi hakkında daha fazla bilgi gelecek haftaki Hot Chips Sempozyumu’nda açıklanabilir – önümüzdeki Salı için Dojo D1 çip mimarisini, Dojo ve ML eğitimini ele alan ve sistem entegrasyonu yoluyla AI’yı etkinleştiren üç Tesla sunumu planlanıyor.