AMD Instinct MI300A APU’nun arkasındaki mühendisler araştırmalarını yayınladılar “exascale heterojen işleme”nin geleceğini tasarlama konusunda. MI300A, bu yıl faaliyete geçtiğinde dünyanın en hızlı süper bilgisayarı olması beklenen El Capitan’ın kalbindeki işlemcidir. İki exaFLOPS’ta çalışması öngörülmektedir.

13 AMD bilim insanı, exaFLOPS performansına ulaşmanın yollarını ve araçlarını belirleyen son araştırma makalesinde iş birliği yaptı. Yukarıdaki X’ten (eski adıyla Twitter) gelen ileti dizisi, makalenin yazarlarından birinin gönderdiği araştırma sürecinin mükemmel bir kuşbakışı görünümünü sunuyor. MI300A’nın varlığı şüphesiz yeni bir haber değil, ilk olarak Mayıs 2023’te kamuoyunun bilgisine sunulmuş olsa da, dün ISCA 2024’te sunulan yeni makale, sosisin nasıl yapıldığına ışık tutmaya yardımcı oluyor – tam da AMD’nin exascale hesaplama için özel GPU’lar yerine APU’lara öncelik vermesine yol açan düşünce tarzı.

Instinct MI300A’nın doğuşu, ABD Enerji Bakanlığı’nın on yıldan uzun bir süre önce AMD’yi süper bilgisayar araştırmalarına katılmaya seçmesiyle gerçekleşti. Enerji Bakanlığı, exaflop hızlarında çalışan süper bilgisayarlara bakıyordu ancak Moore Yasası’nın sonu ufukta belirince, onlara ulaşmak için daha derin yenilikler yapılması gerektiğini biliyordu. AMD güçlü olmasına rağmen, ayrı grafik kartlarının ölçeklenebilir ve exascale olmak için çok fazla alan kısıtlaması ve güç çekişi getireceğini düşünüyordu. Bu nedenle, “Exascale Heterojen İşlemci” üzerinde araştırmaya başladı. Kendisinin birden fazla kopyasıyla senkronize olabilen güçlü bir kurumsal APU tasarlamaya dayanan EHP projesi, ilk olarak bir exaFLOPS’a ulaşan dünyanın ilk süper bilgisayarı olan Frontier’da ortaya çıktı.

(Görsel kaynağı: Alan Smith ve diğerleri)

Frontier süper bilgisayarı ilk piyasaya sürüldüğünde dünyanın en hızlı süper bilgisayarı olarak büyük bir başarı elde etmiş olsa da AMD, EHP planlarını tam olarak gerçekleştirememişti. Frontier, EHP araştırmalarının temellerine dayanıyordu ancak AMD’nin umduğu hepsi bir arada APU çözümü yerine özel MI250X grafik hızlandırıcıları kullanıyordu. Frontier’ı zamanında teslim etmek için bu fedakarlık yapılmalıydı çünkü AMD’nin V-Cache yığınlama teknolojisi umut vericiydi ancak henüz tam olarak hazır değildi. Frontier sırasında planlanan EHP’nin üçüncü revizyonu, o zamanlar imkansız olan diğer görevlerin yanı sıra, her GPU yongasının üzerine HBM modüllerinin yığılmasını gerektiriyordu. 3D V-Cache fırında daha uzun süre beklemek zorundaydı, bu da Frontier’ın kusurlu ancak güçlü bir durumda piyasaya sürülmesi anlamına geliyordu.

Sonunda, 3D V-Cache bugün olduğu devrim niteliğindeki teknoloji haline geldi ve EHP bitiş çizgisine doğru son bir hamle yapmaya hazırdı. Yeni APU, Frontier içindeki EPYC işlemcisinin CPU mimarisine dayanarak doğdu. Birleşik bir Infinity Fabric bellek veri yoluyla MI300A, grafik ve işlem çekirdekleri arasında TB/sn olarak ölçülen aktarım sürelerine nihayet ulaşabildi.

(Görsel kaynağı: Alan Smith ve diğerleri)

EHP Projesi’nin son hali olan MI300A şaka değil. APU, 228 CDNA 3 GPU hesaplama birimi ve 5,2 GT/s hızında çalışan 128 GB birleşik HBM3 belleğin yanı sıra üç yongada 24 Zen 4 x86 CPU çekirdeği barındırıyor ve hepsi 4. nesil Infinity mimarisine dokunmuş durumda. Teknik özellik sayfasındaki sayılar yazım yanlışı gibi görünüyor, 5,3 TB/s’lik bir tepe bellek bant genişliği ve 3922 TFLOPS’luk teorik bir tepe AI performansı (buraya üç farklı feragatname ekleyin).

MI300A APU’daki GPU performansı, Frontier’daki MI250X’lerin özel GPU performansına kıyasla önemli ölçüde artar. Bir dizi HPC iş yükü sentetik kıyaslamasında birbirlerine karşı test edilen MI300A, MI250X’ten 1,25x ila 2,75x daha hızlı sonuçlar verir. Ortalama olarak performansın iki katına çıkması, AMD ve Enerji Bakanlığı’nın EHP için savaşmakta haklı olduğunu kesinlikle kanıtlıyor.

(Görsel kaynağı: Alan Smith ve diğerleri)

Elbette, MI300A bağımsız olarak performans göstermek için tasarlanmamıştır, çünkü dört APU’luk bir dizide kullanılmak üzere tasarlanmıştır. Her APU’nun sekiz adet 128 GB/s Infinity Fabric arayüzü vardır ve bu da 1 TB/s çift yönlü bağlantıyla sonuçlanır. Dört APU’luk bir yapılandırmada, APU’lar her biri yüksek hızlarda iletişim kurabilirken aynı zamanda bir PCIe Gen5 x16 bağlantısına da sahip olabilir. Bunu bir süper bilgisayara ölçeklendirin ve Enerji Bakanlığı’nın en yeni oyuncağı olan El Capitan’ın iki exaFLOPS’ta çalışması tahmin ediliyor.



genel-21