Intel bugün, Ponte Vecchio olarak bildiğimiz ve sevdiğimiz aynı platform olan Intel Veri Merkezi GPU’sunu ve Intel’in GPU hedeflerini başlatan fikri duyurdu. Intel, bu platform hakkında birçok bilgi ve kıyaslama paylaştı ve şimdiden Argonne’a gönderilmeye başladığı göz önüne alındığında, gerçek performans karşılaştırmalarını şimdi görmeye başlamamız gerçekten şaşırtıcı değil.

Intel, Ponte Vecchio’yu Data Center GPU Max olarak resmen başlattı, sunucu blade’leri zaten sevk ediliyor

Intel ‘Ponte Vecchio’ GPU veya şirketin şimdi adlandırmayı sevdiği adıyla ‘Intel Data Center GPU Max Serisi’, 128 Xe Çekirdeği, 128 RT çekirdeğe sahip büyük bir üründür. yerel ışın izleme çekirdeği), 64 MB’ye kadar L1 Önbellek ve 408 MB’ye kadar L2 önbellek. 128 GB HBM2e de kullanıldı ve IO 8 adede kadar ayrı kalıbı bağlayacak. PCIe Gen 5, muazzam miktarda işlem gücü sağlamak için Xe Link ile birlikte kullanılıyor. EMIB ve Foveros yaklaşımlarıyla paketlenmiş Intel 7, TSMC N5 ve TSMC N7 karışımı kullanılarak oluşturulmuştur.

intel-sc-22-press-deck-final-ambargo-6am-pt-nov-9-1-page-054
intel-sc-22-press-deck-final-ambargo-6am-pt-nov-9-1-page-053

Max Serisi GPU’lar, farklı müşteri ihtiyaçlarını karşılamak için çeşitli form faktörlerinde sunulacak:

  • Max Serisi 1100 GPU’lar: 56 Xe çekirdeği ve 48 GB HBM2e ile 300 watt çift genişlikte PCIe kartı
    hafıza. Intel Xe Link köprüleri aracılığıyla birden fazla kart bağlanabilir.
  • Max Serisi 1350 GPU’lar: 112 Xe çekirdekli ve 96 GB HBM’li 450 watt’lık bir OAM modülü.
  • Maksimum Seri 1550 GPU’lar: 128 Xe ile Intel’in maksimum performanslı 600 watt OAM modülü
    çekirdekler ve 128 GB HBM.

Intel, mimarinin mutlak canavar modu performansı için 8 adede kadar OAM’nin bağlanmasına izin vereceğini söylüyor ve 4 OAM için verdikleri sayılara dayanarak aşağıdakileri hesaplayabiliriz:

  • 1 MAO: 128 GB HBM2e, 128 Xe Çekirdeği, 600W TDP, 52TFLOP, 3,2 TB/bellek bant genişliği
  • 2 OAM: 256GB HBM2e, 256 Xe Çekirdeği, 1200W TDP, 104 TFLOPS, 6,4 TB/s bellek bant genişliği
  • 4 OAM: 512 GB HBM2e, 512 Xe Çekirdeği, 2400W TDP, 208 TFLOPS, 12,8 TB/s bellek bant genişliği

Şimdi performans hakkında konuşalım.

Max Serisi GPU’lar, en zorlu bilgi işlem iş yüklerini hedefleyen yeni temel mimari olan 128 adede kadar Xe-HPC çekirdeği sunar. Ek olarak, Max Serisi GPU’da şunlar bulunur:

Intel, her OAM’nin OpenMC ve miniBUDE’daki bir NVIDIA 100’den 2 kat daha fazla olduğunu iddia ediyor.

Intel, Intel Veri Merkezi GPU Max Serisinin AdvSub, FDM (FP32), AxHelm (FP32) ve AxHelm (FP64) gibi ExaSMR – NekRS sanal nükleer reaktör simülasyon iş yüklerinde toplam 1,5 kat performans liderliğine sahip olduğunu belirtiyor.

Son olarak, kredi seçenekleri fiyatlandırma modellerini eğitmek için kullanılan Riskfuel gibi finansal iş yüklerinde (NVIDIA A100 ile karşılaştırıldığında) performans tacını da talep ediyorlar.

Intel ayrıca Ponte Vecchio’nun canavar halefi olan Rialto Köprüsü’nü serbest bırakma niyetini de yineledi. Yeni bir OAM v2 form faktöründe 160 adede kadar Xe çekirdeği barındıracak. GPU’daki en büyük değişiklik, kalıp düzeninde. Ponte Vecchio, her biri toplam 128 çekirdek veya 16.384 ALU için 8 Xe çekirdeğe sahip 16 Xe-HPC kalıbına sahipken, Rialto Bridge GPU, 8 adet 16 Xe-HPC kalıbıyla birlikte gelir. Bu, 8 kalıpta toplam 160 Xe çekirdeği için kalıp başına 20 Xe çekirdeği olmalıdır. Bu, önceki modele göre yüzde 25’lik bir artış olan 20.480 ALU’ya ulaşıyor.

Sunumun tamamı aşağıda görülebilir:



genel-17