AMD’nin Instinct MI300A APU’ları, geleneksel ayrık GPU’lara kıyasla HPC iş yüklerinde önemli bir performans artışı sağlar.
Ayrık GPU’ları Bir Kenara Bırakın, AMD’nin Instinct MI300A APU’ları HPC İş Yüklerini 4 Kat’a Kadar Performansla Güçlendirecek
AMD Instinct MI300A, yıllar önce ortaya atılan “Exascale APU” platformunun hayata geçirilmesidir. Buradaki fikir, yüksek performanslı bir GPU’yu, yüksek performanslı bir CPU’nun yanı sıra, birleşik bir bellek havuzundan yararlanan aynı pakette paketlemekti. HPC için bu hızlandırıcılar/ortak işlemci tasarımları, watt başına daha yüksek performans avantajları sağlar ancak milyonlarca satır kod içeren çok sayıda uygulamanın taşınması, ayarlanması ve bakımının yapılmasını gerektirir ve bu da biraz karmaşık olabilir. Ancak görünen o ki araştırmacılar, AMD’nin yeni nesil APU ezici gücünden tam olarak yararlanmak için iki popüler programlama modeli olan OpenMP ve OpenACC’yi kullandılar.
Bu araştırma makalesi için “Birleşik Bellek ve OpenMP Kullanarak HPC Uygulamalarını AMD Instinct MI300A’ya Taşıma“, açık kaynaklı bir C++ kütüphanesi olan OpenFOAM çerçevesi kullanılır:
- APU programlama modelinin bir planını sağlıyoruz ve OpenMP ile MI300A’da kod taşımanın kolaylığını ve esnekliğini gösteriyoruz.
- Üretimin artan şekilde hızlandırılmasına yönelik ve endüstri kodunda yaygın olarak kullanılan yöntemimizi (OpenFOAM) geliştiriyoruz.
AMD Instinct MI300A hızlandırıcı, birleşik bir HBM arayüzü kullandığından, veri çoğaltma ihtiyacını ortadan kaldırır ve ana bilgisayar ile cihazın bellek alanları arasında programlama ayrımı gerektirmez. Ayrıca AMD’nin ROCm yazılım paketi, APU’nun tüm bölümlerini tek bir tutarlı ve heterojen pakette birleştirmeye yardımcı olan ek optimizasyonlar sağlar. AMD’nin Instinct MI300A APU’ları hakkında küçük bir özet olarak:
- İlk Entegre CPU+GPU Paketi
- Exascale Süper Bilgisayar Pazarını Hedeflemek
- AMD MI300A (Entegre CPU + GPU)
- 153 Milyar Transistör
- 24’e kadar Zen 4 Çekirdeği
- CDNA 3 GPU Mimarisi
- 192 GB’a kadar HBM3 Bellek
- 8 Chiplet’e kadar + 8 Bellek Yığını (5nm + 6nm işlem)
Sonuç olarak, performans büyük bir fayda sağlar. OpenFOAM’ın HPC motorlu bisiklet kıyaslaması kullanılarak yapılan değerlendirmede AMD Instinct MI300A APU, AMD Instinct MI210, NVIDIA A100 80 GB ve NVIDIA H100 (80 GB) GPU’ya karşı test edildi. AMD GPU’lar ROCm 6.0 yığınında çalışıyordu ve NVIDIA GPU’lar CUDA 12.2.2 yığınında çalışıyordu. Karşılaştırma, zaman adımı başına ortalama yürütme süresi (saniye) liyakat ölçüsü (FOM) olarak alınarak 20 zaman adımı boyunca çalışacak şekilde yapılandırıldı. Instinct MI300A’nın yanı sıra üç konfigürasyonun tümü ayrı bir CPU kullanıyordu, dolayısıyla GPU’ların sistem belleğini adreslemesine ve karşılaştırmayı çalıştırmasına izin vermek için soketli bir CPU, heterojen bellek yönetimiyle yapılandırıldı.
Testlere gelince, sonuçlar, üç ayrı yonga arasında en iyi ayrık GPU performansını sunan NVIDIA H100 sistemine göre normalleştirildi, ancak Instinct MI300A APU, NVIDIA H100’e göre 4 kat ve Instinct MI210 hızlandırıcıya göre 5 kat kazanç elde etti .
- OndGPU’larda zamanın %65’inden fazlası sayfa geçişlerinde harcanır: GPU tablolarının güncellenmesi ve ana makine ile cihaz arasında verilerin kopyalanması.
- APU’da, CPU çekirdekleri ve GPU’nun bilgi işlem birimleri arasında paylaşılan birleşik fiziksel bellek, sayfa taşıma yükünü tamamen ortadan kaldırır ve bu da önemli bir performans artışı sağlar.
Ayrıca, tekil Zen 4 CPU paketine sahip AMD Instinct MI300A’nın, ayrı bir GPU çözümüyle çalışan tek soketli Zen 4 CPU’dan iki kat daha hızlı olduğu da keşfedildi. MI300A APU’nun birden fazla işlemle aşırı yüklenmesi, performansı 2 kat artırdı (APU başına 3-6 CPU çekirdeği ile test). Bu, dGPU+dCPU yapılandırmasındaki ölçeklenebilirlik eksikliğinden çok daha iyi.
Sonuç olarak, AMD Instinct MI300A APU’nun bilgi işlem yetenekleri HPC segmentinde eşsiz olacak gibi görünüyor. Yapay zeka bugünlerde en büyük çılgınlık gibi göründüğü için NVIDIA, yeni nesil Blackwell serisinde geleneksel HPC performansından geri adım attı ve AMD, MI300X hızlandırıcıları ve gelecekteki yenilemeleriyle bu sorunu ele alacak olsa da, HPC segmentine benziyor AMD’yi ön plana çıkaracak.
Haber kaynağı: Nicholas Malaya