Ampere bu hafta tanıttı AmpereOne işlemciler AI çıkarımı için kullanılabilen 132 adede kadar endüstrinin ilk genel amaçlı CPU’ları olan bulut veri merkezleri için.
Yeni yongalar, öncekilerden – Ampere Altra’dan (en azından bir süre Ampere’in kararlılığında kalacak) – daha fazla güç tüketiyor, ancak şirket, daha yüksek güç tüketimine rağmen, 192 adede kadar çekirdeğe sahip işlemcilerinin CPU’lardan daha yüksek hesaplama yoğunluğu sağladığını iddia ediyor. AMD ve Intel’den. Bu performans iddialarından bazıları tartışmalı olabilir.
192 Özel Bulut Yerel Çekirdeği
Ampere’nin AmpereOne işlemcileri, şirketin Armv8.6+ komut seti mimarisinin (iki adet 128-bit vektör içeren) tescilli uygulamasına dayanan 3.0 GHz’e kadar çalışan 136 – 192 çekirdeğe (Ampere Altra için 32 ila 128 çekirdeğin aksine) sahiptir. Çekirdek başına 2MB 8 yollu ilişkilendirilebilirlik L2 önbelleği (1MB’den yukarı) ile donatılmış ve 64 ev düğümü ve dizin tabanlı gözetleme ile bir mekanik ağ kullanılarak birbirine bağlanan FP16, BF16, INT16 ve INT8 biçimlerini destekleyen birimler) filtre. L1 ve L2 önbelleklerine ek olarak, SoC ayrıca 64MB sistem düzeyinde bir önbelleğe sahiptir. Yeni CPU’lar, tam SKU’ya bağlı olarak 200 W – 350 W olarak derecelendirilirken, Ampere Altra için 40 W – 180 W arasında derecelendirilmiştir.
Şirket, yeni çekirdeklerinin bulut ve yapay zeka iş yükleri için daha da optimize edildiğini ve saat başına ‘güç ve verimli’ talimat (IPC) kazanımları içerdiğini iddia ediyor, bu da muhtemelen somut bir artış olmadan daha yüksek IPC (Altra için kullanılan Arm’s Neoverse N1 ile karşılaştırıldığında) anlamına geliyor güç tüketimi ve kalıp alanında. Kalıp alanından bahsetmişken, Ampere bunu açıklamaz, ancak AmpereOne’ın TSMC’nin 5nm sınıfı işlem teknolojisinden birinde yapıldığını söyler.
Ampere, AmpereOne çekirdeğiyle ilgili tüm ayrıntıları açıklamasa da, son derece hassas bir L1 veri ön getiriciye sahip olduklarını söylüyor (gecikmeyi azaltır, CPU’nun verileri beklerken daha az zaman harcamasını sağlar ve bellek erişimlerini en aza indirerek sistem güç tüketimini azaltır), rafine şube yanlış tahmin kurtarma (CPU bir şube yanlış tahminini ne kadar çabuk algılar ve kurtarırsa, gecikmeyi azaltır ve daha az güç harcar) ve gelişmiş bellek belirsizliğini giderme (IPC’yi artırır, ardışık düzen durmalarını en aza indirir, sıra dışı yürütmeyi en üst düzeye çıkarır, gecikme süresi ve sanallaştırılmış ortamlarda çoklu okuma/yazma isteklerinin işlenmesini geliştirir).
AmpereOne çekirdek mimarisi geliştirmelerinin listesi kağıt üzerinde çok uzun görünmese de, bu şeyler gerçekten performansı önemli ölçüde artırabilir ve çok fazla araştırma yapılmasını gerektirir (yani, bir bulut veri merkezi CPU’sunun performansını en çok hangi şeyler yavaşlatır?) ve verimli bir şekilde uygulamak için çok fazla iş var.
Gelişmiş Güvenlik ve G/Ç
AmpereOne SoC, bulut veri merkezlerini hedeflediğinden, yuva başına 8 TB’a kadar belleği destekleyen 16 adede kadar modül için sekiz DDR5 kanalı, 32 denetleyici ve x4 çatallanma ile 128 şeritli PCIe Gen5 içeren uygun G/Ç ile donatılmıştır.
Veri merkezleri ayrıca belirli güvenilirlik, kullanılabilirlik, hizmet verebilirlik (RAS) ve güvenlik özellikleri gerektirir. Bu amaçla SoC, bunlardan birkaçını saymak gerekirse ECC belleğini, tek anahtarlı bellek şifrelemesini, bellek etiketlemeyi, güvenli sanallaştırmayı ve iç içe sanallaştırmayı tam olarak destekler. Ayrıca AmpereOne, kripto ve entropi hızlandırıcıları, spekülatif yan kanal saldırılarını hafifletme, ROP/JOP saldırılarını azaltma vb. gibi çok sayıda güvenlik özelliğine sahiptir.
Meraklı Kıyaslama Sonuçları
Hiç şüphesiz, Ampere’nin AmpereOne SoC’si, bulut iş yüklerinin üstesinden gelmek için tasarlanmış ve endüstride bir ilk olan 192 genel amaçlı çekirdeğe sahip etkileyici bir silikon parçasıdır. Yine de Ampere, puanlarını kanıtlamak için oldukça ilginç kıyaslama sonuçları kullanıyor.
Ampere, AmpereOne’ın işlem yoğunluğunu ana avantajı olarak görüyor. Şirket, 192 çekirdekli AmpereOne SoC tabanlı 1S makinelerle dolu bir 42U 16,5kW rafın 7926 adede kadar sanal makineyi destekleyebileceğini, buna karşılık AMD’nin 96 çekirdekli EPYC 9654 “Genoa” tabanlı bir rafın 2496 VM’yi ve raftan güç alan bir rafı işleyebileceğini iddia ediyor. Intel’in 56 çekirdekli Xeon Ölçeklenebilir 8480+ ‘Sapphire Rapids’ CPU’ları 1680 VM’yi işleyebilir. Bu karşılaştırma, 16.5kW güç bütçesinde çok anlamlıdır.
Ancak 42U raf gücü yoğunluğu artıyor ve AWS, Google ve Microsoft gibi exascaler’lar özellikle performans gerektiren iş yükleri için buna hazır. tarafından yapılan bir ankete dayanmaktadır. UpTime Enstitüsü 2020’de şirketlerin %16’sının kabin güç yoğunluğu 20kW’tan 50kW’ın üzerine kadar olan tipik 42U rakc’ler kullandığını söyleyebiliriz. AMD’nin en yeni ve önceki nesil CPU’ları öncekilere kıyasla TDP’lerini artırdığından, şimdiye kadar 20kW raflı tipik dağıtımların sayısı azalmadı, arttı.
Performans söz konusu olduğunda Ampere, 256 GB RAM ile AMD’nin 96 çekirdekli EPYC 9654 CPU’suna dayalı sistemlere karşı Üretken AI (stabil difüzyon) ve AI Öneri Aracı (DLRM) çalıştıran 512 GB belleğe sahip 160 çekirdekli AmpereOne tabanlı sisteminin avantajlarını gösteriyor. bellek (Cenova tarafından desteklenen 12 kanallı modda değil, sekiz kanallı modda çalıştığı anlamına gelir). Amper tabanlı makineler, üretken yapay zeka için 2,3 kat daha fazla çerçeve/sn ve yapay zeka önerileri için 2 kat daha fazla sorgu/s üretti.
Bu durumda Ampere, veri işleyen sistemlerinin performansını FP16 hassasiyetiyle karşılaştırırken, AMD tabanlı makineler FP32 hassasiyetiyle hesapladı ki bu elmadan elmaya bir karşılaştırma değildir. Ayrıca, birçok FP16 iş yükü artık CPU’lar yerine GPU’larda çalıştırılıyor ve büyük ölçüde paralel GPU’lar, üretken yapay zeka ve yapay zeka önerileri iş yükleriyle muhteşem sonuçlar sunma eğiliminde.
Özet
Ampere’in AmpereOne’ı, 192 adede kadar çekirdeğe sahip, kesinlikle büyük saygıyı hak eden, endüstrideki ilk genel amaçlı CPU’lardır. Bu CPU’lar aynı zamanda güçlü G/Ç yeteneklerine, gelişmiş güvenlik özelliklerine sahiptir ve saat başına iyileştirilmiş talimat (IPC) kazanımları vaat eder. Ayrıca AI iş yüklerini FP16, BF16, FP8 ve INT8 hassasiyetinde çalıştırabilirler.
Ancak şirket, başarılarına biraz gölge düşüren kıyaslama sonuçları söz konusu olduğunda puanlarını kanıtlamak için oldukça tartışmalı yöntemler kullanmayı seçti. Bununla birlikte, AmpereOne tabanlı sunucuların bağımsız test sonuçlarını görmek özellikle ilginç olacaktır.