Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Alibaba Cloud, Nvidia’nın ara bağlantısını Ethernet lehine terk etti – teknoloji devi, veri merkezi içindeki 15.000 GPU’yu bağlamak için kendi Yüksek Performans Ağını kullanıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Alibaba Cloud, Nvidia’nın ara bağlantısını Ethernet lehine terk etti – teknoloji devi, veri merkezi içindeki 15.000 GPU’yu bağlamak için kendi Yüksek Performans Ağını kullanıyor

Liste

Alibaba Cloud, Nvidia’nın ara bağlantısını Ethernet lehine terk etti – teknoloji devi, veri merkezi içindeki 15.000 GPU’yu bağlamak için kendi Yüksek Performans Ağını kullanıyor

teknomers
Son güncelleme: 30 Haziran 2024 05:41
teknomers
Paylaş
Paylaş



Alibaba Bulut mühendisi ve araştırmacısı Ennan Zhai, araştırma makalesini şu adresten paylaştı: GitHubBulut sağlayıcısının LLM eğitimi için kullanılan veri merkezlerine yönelik tasarımını ortaya koyuyor. “Alibaba HPN: Büyük Dil Modeli Eğitimi için Bir Veri Merkezi Ağı” başlıklı PDF belgesi, Alibaba’nın 15.000 GPU’sunun birbiriyle iletişim kurmasına izin vermek için Ethernet’i nasıl kullandığını özetliyor.

Genel bulut bilişim, 10 Gbps’den düşük hızlarda tutarlı ancak küçük veri akışları üretir. Öte yandan, LLM eğitimi 400 Gbps’ye kadar ulaşabilen periyodik veri patlamaları üretir. Makaleye göre, “LLM eğitiminin bu özelliği, geleneksel veri merkezlerinde yaygın olarak kullanılan yük dengeleme şeması olan Eşit Maliyetli Çoklu Yol’u (ECMP) karma kutuplaşmasına yatkın hale getirir ve bu da eşit olmayan trafik dağılımı gibi sorunlara neden olur.”

Bunu önlemek için Zhai ve ekibi, olası ECMP oluşumlarının sayısını azaltırken sistemin “fil akışlarını tutabilen ağ yollarını hassas bir şekilde seçmesine” izin veren “2 katmanlı, çift düzlemli mimari” kullanan Yüksek Performanslı Ağ’ı (HPN) geliştirdi. HPN ayrıca, birbirlerini yedeklemelerine olanak tanıyan çift raf üstü (ToR) anahtarları kullandı. Bu anahtarlar, LLM eğitimi için en yaygın tek nokta arızalarıdır ve GPU’ların yinelemeleri senkronize bir şekilde tamamlamasını gerektirir.

Ana bilgisayar başına sekiz GPU, veri merkezi başına 1.875 ana bilgisayar

Alibaba Cloud veri merkezlerini ana bilgisayarlara böldü ve bir ana bilgisayar sekiz GPU ile donatıldı. Her GPU’nun iki portlu ağ arayüz kartı (NIC) vardır ve her GPU-NIC sistemi bir ‘ray’ olarak adlandırılır. Ana bilgisayar ayrıca arka uç ağına bağlanmak için fazladan bir NIC alır. Daha sonra her ray iki farklı ToR anahtarına bağlanır ve bir anahtar arızalansa bile tüm ana bilgisayarın etkilenmemesini sağlar.

Alibaba Cloud, NVlink’i ana bilgisayarlar arası iletişim için terk etmesine rağmen, ana bilgisayar içi ağ için hala Nvidia’nın tescilli teknolojisini kullanıyor, çünkü bir ana bilgisayar içindeki GPU’lar arasındaki iletişim daha fazla bant genişliği gerektiriyor. Ancak, raylar arasındaki iletişim çok daha yavaş olduğundan, ana bilgisayar başına “özel 400 Gbps RDMA ağ verimi, toplam 3,2 Tbps bant genişliğiyle sonuçlanıyor”, PCIe Gen5x16 grafik kartlarının bant genişliğini en üst düzeye çıkarmak için fazlasıyla yeterli.

Alibaba Cloud ayrıca 51,2 Tb/sn Ethernet tek çipli ToR anahtarı kullanır, çünkü çok çipli çözümler daha fazla kararsızlığa eğilimlidir ve tek çipli anahtarlara göre dört kat daha fazla arıza oranına sahiptir. Ancak bu anahtarlar sıcak çalışır ve piyasadaki hiçbir hazır ısı emici, aşırı ısınma nedeniyle kapanmalarını engelleyemez. Bu nedenle şirket, termal enerjiyi çok daha verimli bir şekilde taşımak için merkezde daha fazla sütun bulunan bir buhar odası ısı emici oluşturarak yenilikçi çözümünü yarattı.

Ennan Zhai ve ekibi, çalışmalarını bu Ağustos ayında Avustralya, Sidney’de düzenlenecek SIGCOMM (Veri İletişimleri Özel İlgi Grubu) konferansında sunacaklar. AMD, Intel, Google ve Microsoft dahil olmak üzere birçok şirket, öncelikle NVlink ile rekabet edecek açık standartlı bir bağlantı seti olan Ultra Accelerator Link’i oluşturmak için bir araya geldikleri için bu projeyle ilgilenecektir. Bu özellikle Alibaba Cloud’un HPN’yi sekiz aydan uzun süredir kullanıyor olması nedeniyle geçerlidir, yani bu teknoloji zaten denenmiş ve test edilmiştir.

Tom’s Hardware’in en iyi haberlerini ve derinlemesine incelemelerini doğrudan gelen kutunuza alın.

Ancak HPN’nin hala bazı dezavantajları vardır; en büyüğü karmaşık kablolama yapısıdır. Her ana bilgisayarın dokuz NICS’si olması ve her NIC’in iki farklı ToR anahtarına bağlı olması nedeniyle, hangi jakın hangi bağlantı noktasına gideceğini karıştırma olasılığı çok yüksektir. Bununla birlikte, bu teknoloji muhtemelen NVlink’ten daha uygun maliyetlidir, bu nedenle veri merkezi kuran herhangi bir kurumun kurulum maliyetlerinden tonlarca tasarruf etmesine olanak tanır (ve hatta belki de Nvidia teknolojisinden kaçınmasına olanak tanır, özellikle de onaylanan şirketlerden biriyse). Çin ile devam eden çip savaşında ABD tarafından).



genel-21

Yapay zeka asistanları: Copilot’u ChatGPT’ye tercih etmek için 7 neden
Bu fırsatla bütçe dostu kalemle çalışan Galaxy Tab S6 Lite’ta 162 $’a kadar tasarruf edin
Siri’nin yeni sağlık özellikleri yalnızca en yeni Apple Watch Series 9 ve Ultra 2’ye geliyor
iPhone 14 Pro’da delik delme kamerası olabilir ve Face ID’yi ekranın altına gizleyebilir
Sebastian Stan Bir Flört Kabusunda Yıldızlar
ETİKETLENDİ:ağınıAlibabaaraBağlamakbağlantısınıClouddeviEthernetEttiGPUyuiçiniçindekiKendiKullanıyorlehinemerkeziNvidianınperformansteknolojiTerkVeriYüksek
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale NYT Bulmaca: 30 Haziran Pazar gününün cevapları
Sonraki Makale Sızdırılan ekran koruyucular iPhone 16 Pro ve 16 Pro Max için yeni ekran boyutlarını gösteriyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Google, 2028’de Intel ile 3 milyon TPU için anlaştı
Donanım
Fortnite’ta TheBurntPeanut Lansmanı ile Yeni Bir Dönem Başlıyor
Oyun
Kritik! Düzgün Yamanmamış Langflow Açığı RCE için Kullanılıyor
Siber Güvenlik
Hindistan Hükümeti Starlink Projesinden Vazgeçti mi?
Genel
Microsoft, Öğrencilerin AI Konuşmalarına Neden Tepki Gösterdiğini Anladı
Liste
Acil: Microsoft Haziran 2026 Yaman Güncellemesi ile 6 Sıfır Gün Açığı!
Siber Güvenlik
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?