Oak Ridge Ulusal Laboratuvarı Summit süper bilgisayarı ve diğer destek sistemleri için veri tutan 250 petabaytlık bir depolama sistemi olan Alpine depolama sistemini devre dışı bıraktı. Şu anda dünyanın dokuzuncu en hızlı süper bilgisayarı olan Summit süper bilgisayarı 1 Kasım’da emekliye ayrılacak, ancak yaşlanan Alpine depolaması o kadar uzun süre hayatta kalamadı.
ORNL, dünyanın en hızlı bilgisayarı olması beklenen ve tahmini 8,5 exaFLOPS performansına sahip Discovery sistemine hazırlanırken, selefi Summit’i devre dışı bırakma zamanı geldi. Summit’in başlangıçta 2023’te kapatılması planlanıyordu, ancak yüksek üretkenlik oranları Enerji Bakanlığı’nın onu bir yıl daha çalışır durumda tutmasına yol açtı. Ne yazık ki, depolama alanı bu kadar uzun süre dayanamadı.
Alpine, ORNL’nin Summit ve çevre birimleri için depolama çözümünün bir parçasıydı ve süper bilgisayardan ve Summit’in hesaplamalarını ön ve son işleyen harici düğümlerinden gelen geçici verileri tutuyordu. Alpine depolama sistemi, 32.494 adet 10TB NL-SAS sürücü içinde 250 petabayt kapasite tutuyordu. 77 IBM Elastic Storage Server (ESS) düğümünden oluşan sistem, en üst noktasında 2,2 TB/sn rastgele okuma ve yazma hızlarına sahip olabilirdi. Yine de son yıllarda sürücü arıza oranları kabul edilemez seviyelere ulaştı ve bu da geçici bir yedek depolama sistemi olan Alpine2’nin kurulmasını gerektirdi.
Alpine’i sökme zamanı geldiğinde, ORNL ekibi endüstriyel bir disk sürücü parçalayıcısı sayesinde veri sunucularını iki aydan kısa bir sürede tamamen sökebildi. Dışarıdan bir satıcı, her 10 saniyede bir sabit diski yiyebilen dört fit genişliğinde, üç beygir gücünde bir ünite olan mobil bir parçalayıcı getirdi. ORNL, yaklaşık 12.000 istemciye Summit’in bilgi işlem gücüne erişim sağlıyor, bu nedenle veri güvenliği önemli görülüyordu.
ORNL’de HPC altyapısı grup lideri olan Paul Abston, “Sınıflandırılmış verilerle uğraşmasak da, veriler yine de kullanıcılara aittir ve bunların korunmasını sağlamak bizim sorumluluğumuzdur” dedi. “Parçalayıcının dişleri sürücüleri küçük parçalara ayırır ve bu da onları çalışır bir sürücüye dönüştürmeyi imkansız hale getirir.”
Dışarıdan gelen tedarikçilerin yardımı sayesinde ORNL, Alpine’in 32.000 sürücüsünün tamamını ve ayrıca diğer Summit destek sistemlerinden 10.000 sürücüyü tamamen parçaladı ve geri dönüştürdü. Bu çaba, Oak Ridge’in 2019’da Atlas depolama sistemini sökme konusundaki önceki önemli devre dışı bırakma çabasını çok geride bıraktı; dokuz ay süren 20.000 sabit disklik bir işti. ORNL ayrıca ağır hizmet tipi veri parçalayıcısını satın alarak gelecekteki işleri daha da verimli hale getirdi.
Summit, 2018’deki lansmanından sonra neredeyse bir yıl boyunca elinde tuttuğu bir unvan olan dünyanın en güçlü süper bilgisayarı olarak anıldı. Her biri iki IBM Power9 22 çekirdekli 3.07 GHz CPU ve altı Nvidia Tesla GV100 GPU tarafından desteklenen 4.356 işlem düğümünde çalışır. Summit, 16 IBM ESS düğümünde 50 petabaytlık bir dosya sistemi olan Alpine2 depolama sistemini kullanır. Bu veri-az depolama sistemi, Summit’i kullanım ömrünün sonuna kadar destekleyecek, 19 Kasım’da salt okunur moda geçecek ve sonunda ORNL’nin tamamlayıcı paralel dosya sistemlerinin bulunduğu bir alana adım atacaktır.
Summit’in yeni nesil yerine geçecek Discovery’nin 2027’ye kadar çevrimiçi olması beklenmiyor; potansiyel satıcılar için başvuru süresi 30 Ağustos’ta sona erdi ancak henüz kazanan bir teklif açıklanmadı. Bu arada ORNL, Top500 liderlik tablolarına göre dünyanın en hızlı süper bilgisayarı olan Frontier’ı işletmeye devam ediyor.