AMD’nin Instinct MI350X Serisi AI GPU: Yenilikçi Adımlar ve Yüksek Performans
AMD, Instinct MI350X serisi yapay zeka GPU’larını tanıttı ve CDNA 4 mimarisi ile güçlü bir performans vaadi sundu. Bu yeni nesil GPU’lar, sunucu sistemleri ve veri merkezleri için optimize edilmiş yapılarıyla dikkat çekiyor. Özellikle işlemci mimarisi ve soğutma çözümleri alanındaki yenilikler, AI uygulamaları için önemli bir sıçrama sağlıyor.
Performans Testleri ve Hesaplama Kapasitesi
AMD, MI355X modelinde 32 aktif hesaplama birimi (CU) ile önceki nesil MI300X’tan daha yüksek bir hesaplama verimliliği sunuyor. Her CU için FP8 işlem kapasitelerini iki katına çıkararak, 4,096 FLOPS’tan 8,192 FLOPS’a ulaşmış durumda. Burada önemli olan, hesaplama birimlerinin arttırılması yerine, mevcut mimarinin optimize edilmesiyle sağlanan bu performans artışıdır.
AMD’nin seçici paylaşım stratejisi, maliyetleri düşürürken, performansı artırmayı başardı. MI355X, aynı die alanında 5 petaflop FP8 hesaplama kapasitesine sahip ve bu, MI300X’a göre %90’lık bir iyileştirme sunuyor.
Geliştirilmiş I/O Die Tasarımı
MI300X’te dört ayrı I/O die yerine, MI355X’te iki daha büyük die kullanılıyor. Bu tasarım, die sayısındaki azalmanın ötesinde verimlilik artışı sağlıyor. Ayrıca, daha geniş Infinity Fabric veri hattı ile daha düşük voltajlarda ve frekanslarda zirve HBM bant genişliği sunmak mümkün hale geliyor. Bu sayede, MI355X, MI300X ile karşılaştırıldığında GB/s başına %30 daha verimli çalışıyor.
Soğutma Çözümleri ve Enerji Verimliliği
AMD, MI355X serisinde, yeni soğutma çözümleri ile beraber, işlem sırasında toplu geçiş kapasitesini düşürerek enerji verimliliğini artırmayı hedefliyor. Özel aktivite tabanlı saat kapatma hücreleri sayesinde, gereksiz saat dalgalarının önüne geçilmesi ve toplam güç tüketiminin azaltılması hedefleniyor. Bu, genel işlemci mimarisinin daha verimli çalışmasına katkı sağlıyor.
Performans Sayıları ve Karşılaştırmalar
MI355X, MLPerf Inference v5.1 benchmark sonuçlarında 93,045 token/saniye hızıyla MI325X’e kıyasla 2.7 kat daha hızlı olduğunu göstermiştir. FP4 ile yapılan inference işlemlerindeki üç kat daha yüksek token üretimi ise, verimliliğin açık bir göstergesi olarak ortaya çıkıyor. AMD, MI355X’in Llama 2 70B’i 10.18 dakikada tamamladığını bildirirken, bu süre Nvidia’nın rakip ürünü GB200’e yakın bir performans sergiliyor.
Sonuç: Geleceğe Yönelik Adımlar
AMD, MI350X serisi ile yalnızca yüksek performanslı işlemci mimarisi sunmakla kalmıyor, aynı zamanda mevcut altyapıya uyum sağlayacak şekilde tasarım yaparak sunucu sistemleri ve veri merkezlerinde önemli avantajlar sağlıyor. Yeni nesil MI400 serisinin de gelmesiyle birlikte, bu teknolojinin daha geniş bir yelpazede nasıl kullanılabileceği, AI ve veri işleme alanında neler getireceği merakla bekleniyor.
Kaynak: Tom’s Hardware verileriyle derlenmiştir.


