İki exaflop performans ile Intel destekli Aurora süper bilgisayarının, şu anda dünyanın en hızlısı olan AMD destekli Frontier süper bilgisayarını yenmesi ve en hızlı süper bilgisayarların Top 500 listesinde başı çekmesi bekleniyor. Ancak, Intel’in donanımı sağlamada devam eden gecikmeleri nedeniyle Aurora, İlk 500 komitesine henüz bir kıyaslama sunmadığı için bugün açıklanan listeye giremedi. Intel bugün sistemle ilgili yeni ayrıntıları paylaştı ve ISC konferansında Aurora süper bilgisayarı için 10.000’den fazla çalışır durumda kanat sağladığını duyurdu; gerçek tam dağıtım için gereken bıçaklar. Ayrıntıları aşağıda ele alacağız.
Ancak Intel, sistemin bu yıl içinde tam olarak faaliyete geçeceğini söylüyor ve Aurora ile AMD ve Nvidia destekli süper bilgisayarlara karşı kafa kafaya mücadele eden kıyaslamaları paylaşarak AMD’nin MI250X GPU’larına göre 2 kat performans avantajı ve Nvidia’nın H100’üne göre %20 kazanç iddia ediyor. GPU’lar.
Intel, hem dördüncü nesil Sapphire Rapids Xeon yongaları hem de Ponte Vecchio GPU’ları olmak üzere 10.000’den fazla blade için Argonne Liderlik Bilgi İşlem Tesisi’ne (ALCF) silikon sağladığını söylüyor.
Ancak Aurora, Intel’in sürekli ertelenen HBM donanımlı Sapphire Rapids “Xeon Max” yongalarıyla çalışacak şekilde tasarlanmıştır. Bu gecikmeler nedeniyle Intel başlangıçta ALCF’ye HBM olmayan Sapphire Rapids yongalarını göndermeye başladı ve tesis geçici bir önlem olarak Aurora’yı standart HBM olmayan Sapphire Rapids yongalarıyla doldurmaya başladı.
Intel şimdi ALCF’ye daha hızlı HBM donanımlı Xeon Max yongaları sağlıyor, ancak teslim edildiğini öne sürdüğü 10.000 blade’in tümünde Max yongaları bulunmuyor. Intel’e sorduk ve şirket temsilcileri tüm kanatların nihai Xeon Max silikonu ile donatılmadığını doğruladı. Şirket bize bıçakların yaklaşık %75’inin silikonun son Xeon Max revizyonunu içerdiğini söylüyor. Muhtemelen, sistemin Top500 listesi için bir kıyaslama sunmasını engelleyen darboğaz budur.
Sistem, raf başına 64 kanat olmak üzere toplam 10.624 kanat olmak üzere 166 kabinden oluşur, bu nedenle teslim edilen 10.000’den fazla kanat sistemin çalışması için yeterlidir – tam performansta değil.
Intel ayrıca Aurora süper bilgisayarı için yukarıdaki slaytta görebileceğiniz ayrıntılı özellikler de dahil olmak üzere daha fazla özellik paylaştı. 21.248 CPU ve 63.744 Ponte Vecchio GPU ile Aurora, yıl sonundan önce tamamen çevrimiçi olduğunda ya iki exaflop performansı yakalayacak ya da aşacak. Sistem ayrıca 10,9 petabayt (PB) DDR5 bellek, CPU’lara bağlı 1,36 PB HBM, 8,16 PB GPU bellek ve 31 TB/s bant genişliği sağlayan 230 PB depolama kapasitesine sahiptir (diğer ilginç ayrıntılar, yukarı kaydırın).
Intel ayrıca, Aurora’nın bir dizi iş yükü üzerinde üretken yapay zeka iş yüklerini yürütmeye başlayacağını da açıkladı. ‘Aurora GPT’ büyük dil modeli bilim odaklı olacak ve Megatron ve DeepSpeed temelleri ile 1 trilyon parametreye sahip olacak. Intel, projenin aşağıdaki özetini sağladı:
“Bilim için bu üretken AI modelleri, genel metin, kod, bilimsel metinler ve biyoloji, kimya, malzeme bilimi, fizik, tıp ve diğer kaynaklardan gelen yapılandırılmış bilimsel veriler üzerinde eğitilecek. Ortaya çıkan modeller (1 trilyona kadar parametreyle) sistem biyolojisi, polimer kimyası ve enerji malzemeleri, iklim bilimi ve kozmoloji alanlarında yeni ve ilginç deneyler önermek için moleküllerin ve malzemelerin tasarımından milyonlarca kaynaktan bilgi sentezine kadar çeşitli bilimsel uygulamalarda kullanılabilir. kanser ve diğer hastalıklarla ilgili biyolojik süreçlerin tanımlanmasını hızlandırmak ve ilaç tasarımı için hedefler önermek için kullanılabilir.”
Intel ayrıca Aurora’nın toplam 128 düğüme sahip iki raflı daha küçük bir versiyonu olan Sunspot sisteminden birkaç kıyaslama testi yaptı. Intel, Sunspot’un performansını, Nvidia A100 GPU’lu ‘benzer boyutta’ Polaris süper bilgisayarını ve AMD’nin MI250X GPU’larından güç alan Crusher süper bilgisayarını temsil eden tahmini sayılarla karşılaştırdı. Ne yazık ki, Intel bu yapılandırmaların test notlarını veya ayrıntılarını sağlamadı, bu nedenle sonuçları normalden daha fazla şüpheyle alın.
Bir reaktör tahmini iş yükündeki tek bir düğüm testinde Intel, sisteminin Nvidia yarışmacısından %45 ve AMD sisteminden %12 daha hızlı olduğunu iddia ediyor. Ölçeklenebilirlik ölçütlerine dönersek Intel, test sistemlerinde kullanılan toplam GPU sayısını 96 GPU’ya normalleştirerek (AMD ve Nvidia düğümlerinin her birinde dört GPU bulunurken, Intel sisteminde düğüm başına altı GPU bulunur) Sunspot’un iki katından fazlasını sağladığını iddia ediyor. Monte Carlo iş yükünde hem AMD hem de Nvidia sistemlerinin performansı. NWChemEx iş yükündeki 90 düğüm için Intel, 90 düğümlü Nvidia destekli Solaris sisteminden %72 daha hızlı olduğunu iddia ediyor.
Aurora süper bilgisayarı ilk olarak 2015’te duyurulmuştu ve tahmini bitiş tarihi 2018’di. O zamanlar sistem, daha sonra iptal edilen Knights Hill işlemcilerini kullanmak üzere tasarlanmıştı. Yeni Aurora’nın 2019’da duyurulması ve bir exaflop’un 2021’de teslim edilmesiyle sistem çok sayıda yeniden tasarım ve yeniden planlama gördü. Yine 2021’in sonlarında başka bir yeniden planlama, sistemin tamamlandığında iki exaflop teslim edeceğini iddia etti. şimdi bu yıl için planlanıyor.
Uzun ve dolambaçlı yol devam ediyor, ama sonunda görünen o ki son en azından görünürde. Intel, sistemi yakında bitirmek için tüm Xeon Max işlemcilerini teslim edeceğini ve sistemin tamamlanıp ilk 500 değerlendirmesini yıl sonundan önce sunacağını söylüyor.