Intel dün Sapphire Rapids sunucu işlemcilerine gelen ilginç yeni bir özelliği ortaya çıkaran yeni bir Linux sürücüsü yayınladı. Bu özellik, silikon bütünlüğü ve güvenilirlik kontrollerini bir sonraki seviyeye taşıyor ve Alan İçi Tarama olarak adlandırılıyor. Phoronix benekli yeni Linux sürücüsü ve dağıtımdan önce veya kritik görevler üzerinde çalışmadan önce sunucu işlemcilerinde hata bulmanın önemini vurguladı.
Sunucular zaten RAM için standart özellikler olarak eşlik veya ECC kontrollerine sahiptir ve depolamaya, ağlar arasında ve daha fazlasına giden ve depolamadan gelen veriler üzerinde benzer kontroller vardır. Ancak, yeni Alan İçi Tarama özelliği özellikle işlemciyi hedefler. Yeni Alan İçi Tarama sisteminin çalışmasını sağlamak için Intel Sapphire Rapids Xeon CPU’ları entegre kontrol özelliklerine sahip olacak ve Alan İçi Tarama çekirdek sürücüsü, kontroller için bir kullanıcı arayüzü sağlayacaktır.
Yazılımın daha derinlerine indikten sonra, kaynak yayın, Intel In-Field Scan sürücüsünün tam CPU testlerini başlatabileceğini söylüyor. Ayrıca, her bir ayrı CPU çekirdeği için test yapılmasına izin veren daha ayrıntılı bir kontrol düzeyi de mevcuttur. Bu tarama sonuçları daha sonra günlük dosyalarına kaydedilir.
Alan İçi Tarama kullanılabilir olduğunda, sistem üreticileri veya yöneticiler bir sunucuyu devreye almadan önce, sunucuda belirli kritik görevler çalıştırılmadan önce veya yalnızca belirli bir zamanlamaya göre çalıştırabilir. Linux sürücüsü artık çıktı, ancak kontroller ve CPU özellikleri hakkında daha fazla bilgi veren CPU’ya özel test dosyaları şu anda mevcut değil.
Neden Şimdi Saha İçi Taramaya İhtiyacımız Var?
İnternet ekonomisi, video/oyun akışı ve bulut bilişim sayesinde devasa veri merkezlerinin büyümesiyle, sunucuların sorunsuz çalışması için yönetilebilirlik giderek daha önemli hale geliyor. Örneğin, belirli CPU’lar veya çekirdekler hataları kendi kendine bildirebiliyorsa, bunlar kolayca bulunabilir ve değiştirilebilir.
Teknolojide Alan İçi Taramayı önemli bir araç haline getirebilecek bir diğer hareket, Angstrom çağına giden yarıştır. Yonga özellikleri daha yüksek yoğunluk, performans ve verimlilik arayışında küçüldükçe, bilinen hatalara ve açıklanamayan hatalara karşı daha duyarlı hale gelirler – bazen yumuşak hatalar olarak adlandırılır.
En son teknoloji ürünü çiplerimizde, fiziği ve transistörlerin fiziksel boyutunu aşırı uçlara zorlamak nedeniyle yumuşak hatalar daha sık meydana gelebilir.
Bazıları, hataların yeni daha küçük çip süreçlerinden değil, sadece bu küçük yapıların evrenin doğasına (yani kozmik ışınlardan) yatkınlığından kaynaklanabileceğini düşünüyor.
Bir yıl önce, son teknoloji NASA uzay keşif aracı Mars Perseverance’ın olduğu haber telleri çarptı. aynı koşu 1998’de Bondi Blue iMac’e güç veren tek çekirdekli Power PC CPU. Kısaca, bu belirgin teknik uyumsuzluğun nedeni, RAD 750’nin (PowerPC 750 tabanlı) 1.000.000 Rad’e ve aşırı sıcaklıklara dayanacak şekilde sertleştirilmesiydi. Ayrıca, daha büyük işlem mantığı kapıları, modern CPU’lara kıyasla kozmik ışın girişimine karşı çok daha az hassastı. Tabii ki, atmosferimiz dünyadaki kozmik radyasyonu azaltır, ancak hala oradadır.
İlginç bir şekilde Intel, Los Alamos Neutron Bilim Merkezi’nde bir parçacık hızlandırıcı kullanarak kozmik ışın girişimiyle ilgili yongalarının ve IC’lerinin hata duyarlılığını enterpolasyon yapıyor.