Seymour Cray’in dünyanın ilk süper bilgisayarı olarak kabul edilen şeyi geliştirmesinden bu yana geçen on yıllarda, CDC 6600 (yeni sekmede açılır), yüksek performanslı bilgi işlem (HPC) topluluğunda bir silahlanma yarışı başladı. Amaç: Her ne pahasına olursa olsun performansı artırmak.
Bilgi işlem, depolama, ağ oluşturma ve yazılım alanlarındaki ilerlemelerle desteklenen önde gelen sistemlerin performansı, 1964’te CDC 6600’ün piyasaya sürülmesinden bu yana, saniyede milyonlarca kayan nokta işleminden (megaFLOPS) bir trilyon kat arttı. kentilyonlar (exaFLOPS).
Tacın şu anki sahibi, ABD merkezli devasa bir süper bilgisayar olan sınır, Yüksek Performanslı Linpack (HPL) karşılaştırmasına göre 1.102 exaFLOPS elde etme yeteneğine sahiptir. Ancak daha da güçlü makinelerin olduğundan şüpheleniliyor. başka yerde çalışıyorkapalı kapılar ardında.
Exascale süper bilgisayarların gelişinin, bilimden siber güvenliğe, sağlıktan finansa neredeyse tüm sektörlere fayda sağlaması ve aksi takdirde eğitilmesi yıllar alacak güçlü yeni AI modellerine zemin hazırlaması bekleniyor.
Bununla birlikte, bu büyüklükteki hızlardaki bir artışın bir bedeli vardır: enerji tüketimi. Tam gaz, Frontier 40MW’a kadar tüketir (yeni sekmede açılır) güç, kabaca 40 milyon ile aynı masaüstü bilgisayarlar.
Süper bilgi işlem her zaman mümkün olanın sınırlarını zorlamakla ilgili olmuştur. Ancak emisyonları en aza indirme ihtiyacı her zamankinden daha net hale geldikçe ve enerji fiyatları yükselmeye devam ettikçe, HPC endüstrisi, orijinal yol gösterici ilkesinin hala izlenmeye değer olup olmadığını yeniden değerlendirmek zorunda kalacak.
Performans ve verimlilik
Bu sorunun ön saflarında faaliyet gösteren bir kuruluş, Dell Technologies ile ortaklaşa olarak tasarımın ön saflarında güç verimliliğine sahip birden fazla süper bilgisayar geliştiren Cambridge Üniversitesi’dir.
bu Wilkes3 (yeni sekmede açılır)örneğin, sıralamada yalnızca 100. sıradadır. genel performans çizelgeleri (yeni sekmede açılır)ancak üçüncü sırada yer alıyor yeşil500 (yeni sekmede açılır)tüketilen enerjinin watt başına performansına dayalı bir HPC sistemleri sıralaması.
ile görüşmede TechRadar ProCambridge Üniversitesi’nde Araştırma Bilgi İşlem Hizmetleri Direktörü Dr. Paul Calleja, kurumun son derece güçlü makinelerden çok yüksek verimli ve verimli makineler oluşturmakla çok daha fazla ilgilendiğini açıkladı.
“Büyük sistemlerle pek ilgilenmiyoruz çünkü bunlar son derece spesifik nokta çözümleri. Ancak içlerinde konuşlandırılan teknolojiler çok daha geniş çapta uygulanabilir ve sistemlerin çok daha düşük maliyetli ve enerji açısından verimli bir şekilde çalışmasını sağlayacak,” diyor Dr. Calleja.
“Bunu yaparak, daha fazla insan için bilgi işlem erişimini demokratikleştiriyorsunuz. Daha geniş bir kitle için çok daha sürdürülebilir süper bilgisayarlar yaratmak için bu büyük çağ sistemleri için tasarlanmış teknolojileri kullanmakla ilgileniyoruz.”
Dr. Calleja, önümüzdeki yıllarda, enerji tüketiminin maliyetlerin %90’ından fazlasını oluşturduğu HPC sektöründe ve daha geniş veri merkezi topluluğunda güç verimliliği için giderek daha şiddetli bir baskı öngörüyor.
Ukrayna’daki savaşla ilgili olarak enerji fiyatlarındaki son dalgalanmalar, süper bilgisayarları çalıştırmayı, özellikle aşırı ölçekli hesaplama bağlamında, önemli ölçüde daha pahalı hale getirecek ve watt başına performansın önemini daha da açıklayacaktır.
Wilkes3 bağlamında üniversite, verimlilik düzeyini artırmaya yardımcı olan bir dizi optimizasyon olduğunu tespit etti. Örneğin, ekip, iş yüküne bağlı olarak bazı bileşenlerin çalıştığı saat hızını düşürerek, %20-30 civarında enerji tüketiminde azalma elde etmeyi başardı.
“Belirli bir mimari aile içinde, saat hızının performansla doğrusal bir ilişkisi vardır, ancak güç tüketimi ile kare bir ilişkisi vardır. Katil bu,” diye açıkladı Dr. Calleja.
“Saat hızını azaltmak, güç tüketimini performanstan çok daha hızlı bir oranda azaltır, ancak aynı zamanda bir işi tamamlamak için gereken süreyi de uzatır. Yani bakmamız gereken şey, bir çalışma sırasındaki güç tüketimi değil, gerçekten iş başına tüketilen enerjidir. Tatlı bir nokta var. ”
Yazılım kraldır
Belirli iş yükleri için donanım yapılandırmalarında ince ayar yapmanın ötesinde, depolama ve ağ oluşturma bağlamında ve soğutma ve raf tasarımı gibi bağlantılı disiplinlerde başka yerlerde yapılacak bir dizi optimizasyon da vardır.
Ancak, güç verimliliğini artırma arayışında tahsis edilen kaynakları özellikle nerede görmek istediği sorulduğunda, Dr. Calleja, her şeyden önce yazılıma odaklanması gerektiğini açıkladı.
“Sorun donanım değil, uygulama verimliliğiyle ilgili. İleriye dönük en büyük darboğaz bu olacak” dedi. “Bugünün exascale sistemleri, GPU GPU sistemlerinde uygun ölçekte verimli bir şekilde çalışabilen mimariler ve uygulamaların sayısı azdır.”
“Bugünün teknolojisinden gerçekten yararlanmak için uygulama geliştirmeye çok fazla odaklanmamız gerekiyor. Geliştirme yaşam döngüsü on yıllar boyunca uzanır; Bugün kullanılan yazılım 20-30 yıl önce geliştirildi ve yeniden tasarlanması gereken bu kadar uzun ömürlü bir kodunuz olduğunda bu zor.”
Ancak sorun, HPC endüstrisinin önce yazılımı düşünmeyi alışkanlık haline getirmemiş olmasıdır. Tarihsel olarak, donanıma çok daha fazla dikkat gösterildi, çünkü Dr. Calleja’nın sözleriyle, “kolay; sadece daha hızlı bir çip satın alırsınız. Akıllıca düşünmeye gerek yok”.
“Her on sekiz ayda bir işlemci performansını ikiye katlayan Moore Yasasına sahipken, hiçbir şey yapmanıza gerek yoktu. [on a software level] performansı artırmak için. Ama o günler geride kaldı. Şimdi ilerleme istiyorsak, geri dönüp yazılımı yeniden tasarlamamız gerekiyor.”
Dr. Calleja, bu konuda Intel’i biraz övdü. olarak sunucu donanım alanı satıcı açısından daha çeşitli hale geliyor (çoğu açıdan olumlu bir gelişme), uygulama uyumluluğu bir sorun haline gelme potansiyeline sahip, ancak Intel bir çözüm üzerinde çalışıyor.
“Intel için gördüğüm bir fark, çok fazla yatırım yapmasıdır. [of both funds and time] içine birAPI silikon türleri arasında kod taşınabilirliği geliştirmek için ekosistem. Yarının uygulamalarının ortaya çıkan silikondan faydalanmasını sağlamak için ihtiyacımız olan bu tür alet zincirleri” diye belirtiyor.
Ayrı olarak, Dr. Calleja “bilimsel ihtiyaç” konusuna daha sıkı bir odaklanma çağrısında bulundu. Çoğu zaman, “çeviride işler ters gider”, donanım ve yazılım mimarileri ile son kullanıcının gerçek ihtiyaçları arasında bir uyumsuzluk yaratır.
Sektörler arası işbirliğine yönelik daha enerjik bir yaklaşımın, kullanıcılardan, hizmet sağlayıcılardan ve satıcılardan oluşan bir “erdemli döngü” yaratacağını ve bu da hem performanstan hem de performanstan faydalara dönüşeceğini söylüyor. ve verimlilik perspektifi.
Zetta ölçekli bir gelecek
Tipik bir şekilde, sembolik exascale dönüm noktasının düşmesiyle, dikkat şimdi bir sonrakine çevrilecek: zettascale.
“Zettascale, yerdeki bir sonraki bayrak,” dedi Dr. Calleja, “bugün elde edilemez olan bilgi işlem ilerlemelerinde bir sonraki dönüm noktasına ulaşmak için gereken teknolojileri vurgulayan bir totem.”
“Dünyanın en hızlı sistemleri, bilimsel çıktı açısından, onlardan elde ettiğiniz şey için son derece pahalıdır. Ancak bunlar önemli çünkü mümkün olanın sanatını gösteriyorlar ve sektörü ileriye taşıyorlar.”
Mevcut mahsulden bin kat daha güçlü olan bir zettaFLOPS performansına ulaşabilen sistemlerin, sürdürülebilirlik hedefleriyle uyumlu bir şekilde geliştirilip geliştirilemeyeceği, endüstrinin buluş kapasitesine bağlı olacaktır.
Performans ve güç verimliliği arasında ikili bir ilişki yoktur, ancak uygun bir güç zarfı içinde gerekli performans artışını sağlamak için her alt disiplinde sağlıklı bir zanaat dozu gerekecektir.
Teoride, performansın enerji tüketimine göre altın bir oranı vardır, bu nedenle HPC’nin topluma sağladığı faydaların karbon emisyonlarının harcanmasını haklı çıkardığı söylenebilir.
Kesin rakam elbette pratikte anlaşılması zor olacaktır, ancak fikrin peşinde koşmak, tanım gereği doğru yönde atılmış bir adımdır.