Intel, yeni keşfedilen bir hata nedeniyle dördüncü nesil Xeon Sapphire Rapids işlemcilerinden bazılarının sevkiyatını duraklattığını doğruladı. Intel’in gönderileri durdurduğuna dair bir ihbar aldık ve konuyu takip ederek, Baş Analist Dylan Patel’den konuyla ilgili birkaç ayrıntı öğrendik. Yarı Analiz, Haziran ortasından bu yana belirli SKU’lar için sevkiyatların duraklatıldığını söylüyor. Konuyla ilgili olarak Intel ile görüştük ve şirket şu açıklamayı yaptı: Tom’un Donanımı:

“4. Nesil Intel Xeon Orta Çekirdek Sayısı İşlemcilerinin (SPR-MCC) bir alt kümesinde, belirli koşullar altında sistem çalışmasını kesintiye uğratabilen ve aktif olarak araştırdığımız bir sorunun farkına vardık. Bu sorun, piyasada bulunan yazılımları çalıştırırken gözlenmedi ve diğer 4. Nesil Intel Xeon işlemci SKU’ları (ör. XCC ve HBM) sorunu göstermedi. Beklenen ürün yazılımı hafifletme konusunda güven kazanırken ve kalan gönderileri kısa süre içinde yayınlamayı beklerken, büyük bir ihtiyat nedeniyle bazı SPR MCC gönderilerini geçici olarak duraklattık. .” — Intel Sözcüsü Tom’un Donanımı.

Devam eden bir soruya yanıt olarak Intel ayrıca, ürün yazılımı hafifletme işleminin performans üzerinde bir etkisi olmasını beklemediğini de söyledi.

Intel’in Sapphire Rapids işlemcileri, iki tür temel tasarım kullanılarak oluşturulur: Tek bir çip oluşturmak için dört hesaplama döşemesi (kalıp) kullanan XCC paketi ve tek bir yekpare kalıp kullanan MCC paketi. Yukarıdaki slaytlarda görüldüğü gibi Intel’in yüksek hacimli satışlarının kaynağı olan 32 çekirdeğe kadar olan yongalar için MCC tasarımı kullanılırken, 36 ile 60 çekirdek arasındaki halo yongalar için XCC varyantları kullanılıyor.

Patel, “Intel, Sapphire Rapids’in en yüksek hacimli versiyonu olan Sapphire Rapids MCC ile ilgili bir başka tasarım sorunuyla karşı karşıya kaldı. 2 soketli ve 4 soketli SKU’lar, Haziran ortasından beri bir zamanlama sorunu nedeniyle sevkiyatları duraklattı” dedi.

Intel, sorunun çift ve dört soketli SKU’larla sınırlı olduğunu doğrulamadı, bunun yerine bu sorunu SKU’ların bir “alt kümesi” ile sınırlı olarak sınıflandırdı ve gönderilerdeki duraklamanın ne zaman başladığını belirtmedi. Intel ayrıca Patel’in hatanın zamanlamayla ilgili olduğu yönündeki iddialarını doğrulamadı veya sorunun doğası hakkında bize herhangi bir açıklama yapmadı.

Bir zamanlama sorunu, UPI ara bağlantısından talimat zamanlama sorunlarına kadar herhangi bir sayıda olasılığı içerebilir, bu nedenle, hatanın gerçek doğası şimdilik belirsizliğini koruyor. Intel’in sorunu, görünüşe göre şimdilik doğrulama sürecinde olan bir ürün yazılımı düzeltmesiyle düzeltebileceğini biliyoruz, bu nedenle sorunu düzeltmek için yeniden tasarım veya yeni bir revizyon/adımlama gerektirmeyecektir. Ek olarak, yeni üretici yazılımı yeterli bir düzeltme olduğundan, Intel’in halihazırda sahada olan herhangi bir işlemciyi değiştirmesi gerekmeyebilir – ancak bu, müşterileri için bir doğrulama sorunu oluşturabilir.

Intel, yalnızca Sapphire Rapids’i geciktiren işlem düğümü teknolojisindeki yanlış adımlarından dolayı değil, aynı zamanda daha fazla gecikmeye ve çok sayıda yeni adıma (yeni bir sürüm gerektiren tipik olarak küçük bir yeniden tasarım) yol açan tasarım ve doğrulama metodolojisindeki sorunlar nedeniyle çok sayıda eleştiri aldı. bir sorunu düzeltmek için silikon). Intel’in Sapphire Rapids’i, tasarım/doğrulama yanlış adımlarının 12 adıma yol açtığına dair söylentilerle boğuşuyor. Doğal olarak, bu ciddi üretim gecikmelerine ve kaçırılan lansman tarihlerine yol açtı.

Şirket o zamandan beri tasarım, simülasyon ve doğrulama akışına farklı bir yaklaşım getirmeyi planladığını bildirdi. bu sorunları düzeltecek. Intel, bu ayarlamaların yeni nesil Xeon işlemcilerde tamamen devreye gireceğini söylüyor.

Intel, bu yeni Sapphire Rapids hatasına “piyasada mevcut yazılım çalıştırılırken” rastlanmadığını ve doğrulama sırasında açıkça yakalanmadığını söylüyor. Bu tür bir durum tamamen duyulmamış değildir; neredeyse tüm karmaşık yongalar, bu sorunları azaltabilen veya ortadan kaldırabilen ürün yazılımı, sürücü ve yazılım geçici çözümleriyle ele alınan hem bilinen hem de bilinmeyen hata ve hatalara sahiptir ve bu şekilde gönderilir – modern yarı iletken tasarım ve üretiminin doğası budur.

Örneğin, Intel’in Skylake nesli işlemcileri bilinen 53 hata hatasıyla gönderildi ve altı ay sonra Intel 40 hata hatası daha listeledi. Başka bir örnek, yakın zamanda AMD’nin EPYC Rome yongalarının 1.044 günlük çalışma süresinden sonra çöktüğünün keşfedilmesidir. Bazı hatalar, düzeltilecek kadar kritik görülmediklerinden veya sabit yazılım ve yazılımın bir kombinasyonu ile düzeltildiğinden, düzeltilmeden bırakılır. En kritik hatalar bazen düzeltmek için yeni bir adım gerektirir ki bu en kötü durum senaryosudur. Neyse ki Intel için, burada durum böyle görünmüyor.

Bununla birlikte, hatalar nadir olmamakla birlikte, bu tür hataların gönderilerde durmaya yol açması alışılmadık bir durumdur, bu da bunun sıradan bir hatadan daha fazlası olduğunu ima eder. Intel, Sapphire Rapids sevkiyatlarına ne zaman devam etmeyi planladığını açıklamadı, ancak daha fazlasını öğrendikçe kapsamımızı güncelleyeceğiz.



genel-21