Intel, Hot Chips 34’te şirketin Ponte Vecchio Xe-HPC GPU’sunu detaylandırdı. Sunulan kıyaslamalarda, yonga üreticisi Ponte Vecchio’nun Nvidia A100’den 2,5 kata kadar daha fazla performans sağladığını iddia ediyor. Ancak, alışılmış olduğu gibi, bir tutam tuz ile satıcı tarafından sağlanan karşılaştırma ölçütlerini alın.
Ponte Vecchio, Intel tarafından seçilen birkaç kıyaslamada A100’den önemli farklarla daha iyi performans gösterdi. Intel’in güç merkezi ayrıca miniBUDE’de 2 kat ve ExaSMR’de 1,5 kat üstünlük gösterdi. Ponte Vecchio’nun henüz çıkmadığını ve A100’ün (Amper) 2020’den beri piyasada olduğunu düşünürsek ilginç bir karşılaştırma. AMD’nin Instinct MI250X’inin (Aldebaran) bildirildiğine göre A100’den üç kat daha hızlı olduğunu da unutmayalım. Dolayısıyla Intel, AMD ve Nvidia’nın yeni nesil HPC ürünleri hakkında endişelenmeli.
Intel’in rakamları doğruysa, Ponte Vecchio, Nvidia’nın yeni nesil H100’üne (Hopper) karşı potansiyel bir rakip olabilir. Şimdiye kadar sahip olduğumuz spesifikasyonlara dayanarak, H100’ün A100’den en az iki kat daha hızlı olması gerekiyor, AMD’nin Instinct MI300’ünde daha da tehditkar olan şey, hem Zen 4 CPU hem de CDNA 3 GPU yongalarını tek bir üründe birleştiriyor. Dünyanın ilk veri merkezi APU’su olarak adlandırılan AMD, Instinct MI300’ün Instinct MI250X’e kıyasla AI eğitim performansında 8 kat artış olduğunu iddia ediyor.
Ponte Vecchio üç farklı şekilde sunulacak: OAM, Xe bağlantılı x4 alt sistemi ve çift soketli Sapphire Rapids platformunda Xe bağlantılı x4 alt sistemi. Ne yazık ki, Sapphire Rapids o kadar çok gecikme yaşadı ki artık komik değil. Daha fazla aksilik olmadan, bazı Sapphire Rapids ürünleri nihayet Ekim ayında piyasaya sürülebilir. Bununla birlikte, yüksek hacimli çipler Şubat 2023’e kadar gelmeyebilir.
OAM form faktöründe Ponte Vecchio, hem dört GPU hem de sekiz GPU platformu için destek sunar. İki yığınlı bir Ponte Vecchio konfigürasyonu, FP32 ve FP64 performansının 52 TFLOP’unu pompalar. Karşılaştırma için, tek bir H100 SXM5 modülü, 60 TFLOP FP32 ve 30 TFLOP FP64 performansında zirve yapar.
Ponte Vecchio, 419 TBps’ye kadar bant genişliği sağlayan 64 MB’lık bir kayıt dosyasına sahiptir. L1 ve L2 önbellekleri sırasıyla 64MB ve 408MB’dir. Ponte Vecchio’daki büyük L2 önbelleği, 2D-FFT Case ve DNN Case gibi belirli iş yüklerine fayda sağlar. Sunumda, Intel’in sonuçları, her iki senaryoda da 80MB’den 408MB’ye önemli bir performans artışı ortaya koyuyor.