AMD’nin EPYC 7002 ‘Roma’ sunucu çipleri için en son işlemci revizyon kılavuzu, çip üzerindeki bir çekirdeğin 1.044 günlük çalışma süresinden sonra (~2,93 yıl) askıda kalmasına neden olabilen ilginç yeni bir hatayı (errata) ortaya koyuyor, bu da sıfırlamanız gerekeceği anlamına geliyor çipin düzgün çalışması için sunucu. AMD sorunu çözmeyeceğini söylüyor.

AMD’nin ikinci nesil EPYC işlemcilerini (AMD’nin dördüncü nesil Genoa yongaları en yenileri) etkileyen sorunla ilgili açıklaması kısa ve öz ancak açıklanması gereken çok şey var.

AMD

(İmaj kredisi: AMD)

Sorun, çekirdeğin CC6 uyku durumundan çıkamamasından kaynaklanıyor, ancak AMD, arızanın zamanlamasının, çipin zamanı takip etmesine yardımcı olan referans saat olan yayılma spektrumu ve REFCLK frekansına bağlı olarak değişebileceğini söylüyor.

Reddit kullanıcısı acid_migrain’in makul bir teorisi var çekirdeğin tam zamanlaması hakkında kilitleniyor, “Söylediklerine rağmen, sorun aslında 1042 gün ve kabaca 12 saatte ortaya çıkıyor. TSC 2800 MHz’de çalışıyor ve 2800 * 10**6 * 1042.5 gün neredeyse 0x380000000000000’e eşit, ki tesadüf olamayacak kadar çok sıfır var.”

Düzeltme basittir – ya 1.044 günlük “zamanlayıcınızı” yeniden başlatmak için CPU’yu sıfırlayan 1.044 günlük çalışma süresinden önce yeniden başlatın ya da CC6 uyku durumunu devre dışı bırakın.

Bu hata ilgi çekici olsa da, kullanıcıların çoğunluğu için dikkat çekici değil ve çiplerdeki hatalar kesinlikle sıra dışı değil. Modern CPU’lar, insanoğlunun ürettiği en karmaşık cihazlardır ve neredeyse her zaman, çipler son nakliye revizyonlarına (adımlama) ulaştıktan sonra ya da sırasında keşfedilen çok sayıda hata/hata ile piyasaya çıkarlar.

Milyarlarca transistör iş başındayken, sorunların çıkması kaçınılmazdır: Bir yonganın, piyasaya sürülmeden önce yonganın daha yeni adımlarında veya ürün yazılımı ince ayarlarında düzeltilen bin veya daha fazla hataya/hataya sahip olması alışılmadık bir durum değildir. Bu hatalar, güvenlik açıklarından arızalı bayraklara ve düzgün çalışmayan önbellek etiketlerine kadar her türlü hatayı kapsayabilir ve çip üreticileri bunları lansmandan önce durdurmak için ellerinden gelenin en iyisini yaparlar.



genel-21