Şu tarihte: Süper Bilgisayar 2024 (SC24), Enfabrica Şirketi Yapay zeka veri merkezi ağında bir dönüm noktasını açıkladı: Hızlandırılmış Bilgi İşlem Yapısı (ACF) SuperNIC çip. Bu 3,2 Terabit/saniye (Tbps) Ağ Arayüz Kartı (NIC) SoC Büyük ölçeklenebilirlik sağlayarak büyük ölçekli yapay zeka ve makine öğrenimi (ML) operasyonlarını yeniden tanımlıyor, 500.000’den fazla GPU’dan oluşan kümeleri destekler. Enfabrica da büyüttü 115 milyon dolarlık finansman ve onu yayınlaması bekleniyor (ACF) SüperNIC çip 2025’in ilk çeyreğinde.
Yapay Zeka Ağ Oluşturma Zorluklarının Ele Alınması
Yapay zeka modelleri giderek büyüyüp karmaşıklaştıkça, veri merkezleri GPU’lar gibi çok sayıda özel işlem birimini birbirine bağlama konusunda artan baskılarla karşı karşıya kalıyor. Bu GPU’lar, eğitim ve çıkarımda yüksek hızlı hesaplama için çok önemlidir, ancak mevcut ağ mimarileri arasındaki verimsiz veri hareketi nedeniyle genellikle boşta kalırlar. Buradaki zorluk, darboğazlar veya performans düşüşü olmadan en uygun veri aktarımını sağlamak için binlerce GPU’yu etkili bir şekilde birbirine bağlamaktır.
Geleneksel ağ oluşturma yaklaşımları yaklaşık 100.000 AI bilgi işlem çipini birbirine bağlayabilir Verimsizlikler ve yavaşlamalar ciddi boyutlara ulaşmadan önce bir veri merkezinde. Enfabrica CEO’su Rochan Sankar’a göre şirketin yeni teknolojisi, tek bir AI/ML sisteminde 500.000’e kadar çipi destekliyor. daha büyük ve daha güvenilir yapay zeka modeli hesaplamalarına olanak tanır. Enfabrica’nın ACF SuperNIC’i, geleneksel NIC tasarımlarının kısıtlamalarının üstesinden gelerek GPU kullanımını en üst düzeye çıkarır ve kesinti süresini en aza indirir.
ACF SuperNIC’deki Temel Yenilikler
ACF SuperNIC, modern yapay zeka veri merkezi ihtiyaçlarına göre tasarlanmış, sektörde ilk olan çeşitli özelliklere sahiptir:
- Yüksek Bant Genişliği, Çok Bağlantı Noktalı Bağlantı: ACF SuperNIC, GPU sunucularına çok bağlantı noktalı 800 Gigabit Ethernet sunarak diğer GPU’ya bağlı NIC’lere kıyasla bant genişliğini dört katına çıkarır. Bu kurulum, benzeri görülmemiş bir verim sağlar ve çok yollu esnekliği geliştirerek AI kümeleri arasında güçlü iletişim sağlar.
- Verimli İki Katmanlı Ağ Tasarımı: 32 ağ bağlantı noktası ve 160’a kadar PCIe hattından oluşan yüksek tabanlı yapılandırmayla ACF SuperNIC, yapay zeka veri merkezlerinin genel mimarisini basitleştirir. Bu verimlilik, operatörlerin daha az katman kullanarak büyük kümeler oluşturmasına, gecikmeyi azaltmasına ve GPU’lar arasında veri aktarım verimliliğini artırmasına olanak tanır.
- Ölçeklendirme ve Ölçeklendirme: Enfabrica ACF SuperNIC, yüksek tabanı, yüksek bant genişliği ve eşzamanlı PCIe/Ethernet çoklu yol oluşturma ve veri taşıma yetenekleriyle, sunucu sistemi başına dört ila sekiz yeni nesil GPU’nun ölçeğini benzersiz şekilde büyütebilir ve genişletebilir. Bu, yapay zeka kümelerinin performansını, ölçeğini ve esnekliğini önemli ölçüde artırarak optimum kaynak kullanımı ve ağ verimliliği sağlar.
- Entegre PCIe Arayüz: Çip, 128 ila 160 PCIe hattını destekler ve 5 Tbps’nin üzerinde hızlar sunar. Bu tasarım, veri merkezi omurga anahtarlarıyla yüksek hızlı iletişimi sürdürürken birden fazla GPU’nun tek bir CPU’ya bağlanmasına olanak tanır. Sonuç, büyük ölçekli yapay zeka iş yüklerini destekleyen daha verimli ve esnek bir düzendir.
- Esnek Mesaj Çoklu Yol Oluşturma (RMM): Enfabrica’nın tescilli RMM teknolojisi, yapay zeka kümelerinin güvenilirliğini artırır. RMM, ağ bağlantısı arızalarının veya dalgalanmalarının etkisini azaltarak iş durmalarını önleyerek daha sorunsuz ve daha verimli yapay zeka eğitim süreçleri sağlar. Sankar, özellikle anahtar bağlantı arızalarının sıklaştığı büyük kurulumlarda bu özelliğin önemine dikkat çekiyor.
- Yazılım Tanımlı RDMA Ağı: Bu benzersiz özellik, veri merkezi operatörlerine tam kapsamlı programlanabilirlik ve hata ayıklama yeteneği sağlar ve yazılım tanımlı ağ oluşturmanın (SDN) avantajlarını Uzaktan Doğrudan Bellek Erişimi (RDMA) kurulumlar. Performanstan ödün vermeden bulut ölçekli ağ topolojilerini optimize edebilen taşıma katmanının özelleştirilmesine olanak tanır.
Gelişmiş Dayanıklılık ve Verimlilik
Geleneksel sistemler genellikle GPU’lar ile PCIe anahtarları ve RDMA NIC’ler gibi çeşitli bileşenler arasında bire bir bağlantı gerektirir. Bununla birlikte, bir sistemdeki GPU sayısı arttıkça, anahtar arızalarına bağlı bağlantı riski de artıyor; Shankar’a göre, 100.000’den fazla GPU’lu kurulumlarda her 23 dakikada bir meydana gelen potansiyel kesintiler söz konusu.
ACF SuperNIC, GPU’lardan anahtarlara birden fazla bağlantıyı etkinleştirerek bu sorunu çözer. Bu yedeklilik, bireysel bileşen arızalarının etkisini en aza indirerek sistemin çalışma süresini ve güvenilirliğini artırır.
SuperNIC ayrıca şunları da sunar: Toplu Bellek Bölgeleme özelliğisıfır kopya veri aktarımlarını destekleyen ve optimize eden ana bilgisayar hafıza yönetimi. Gecikmeyi azaltıp bellek verimliliğini artıran bu teknoloji, saniye başına kayan nokta işlemleri (FLOP’lar) GPU sunucu filolarının kullanımı.
Ölçeklenebilirlik ve Operasyonel Avantajlar
ACF SuperNIC’in tasarımı yalnızca ölçekle değil aynı zamanda operasyonel verimlilikle de ilgilidir. Standart iletişim, mevcut arayüzler ve RDMA ağ işlemleriyle entegre olan bir yazılım yığını sağlar. Bu uyumluluk, farklı satıcıların GPU’larından ve hızlandırıcılarından (AI çipleri) oluşan çeşitli AI bilgi işlem ortamlarında verimli dağıtım sağlar. Veri merkezi operatörleri, karmaşıklığı azaltan ve yapay zeka veri merkezlerinin esnekliğini artıran modern ağ altyapısından yararlanır.
Kullanılabilirlik ve Gelecek Beklentiler
Enfabrica’nın ACF SuperNIC’i, 2025’in ilk çeyreğinde sınırlı miktarlarda mevcut olacak; hem çipler hem de pilot sistemler artık Enfabrica ve seçilmiş ortaklar aracılığıyla siparişlere açık olacak. Yapay zeka modelleri daha yüksek performans ve daha büyük ölçekler gerektirdiğinden, Enfabrica’nın yenilikçi yaklaşımı, desteklemek üzere tasarlanmış yeni nesil yapay zeka veri merkezlerinin şekillendirilmesinde önemli bir rol oynayabilir. Sınır yapay zeka modelleri.
Dosyalandı
. Yapay Zeka (Yapay Zeka), Çip, üretken yapay zeka, Yarı İletkenler, Sunucu, SoC ve Süper Bilgisayar hakkında daha fazlasını okuyun.