Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Llama 3 405B sinir ağı eğitim kümesi, yaklaşık altı saatte bir Nvidia H100 hızlandırıcılarının arızalarını kaydetti
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Llama 3 405B sinir ağı eğitim kümesi, yaklaşık altı saatte bir Nvidia H100 hızlandırıcılarının arızalarını kaydetti

Genel

Llama 3 405B sinir ağı eğitim kümesi, yaklaşık altı saatte bir Nvidia H100 hızlandırıcılarının arızalarını kaydetti

teknomers
Son güncelleme: 27 Temmuz 2024 19:50
teknomers
Paylaş
Paylaş


Modern büyük sinir ağları, çok sayıda bileşene sahip sistemler üzerinde eğitilir. Ve ne kadar çok bileşen olursa, arıza olasılığı da o kadar yüksek olur. Meta*’nın yakın tarihli bir raporu, şirketin Nvidia H100 hızlandırıcılarıyla yaklaşık üç saatte bir çökme yaşadığını ortaya koyuyor.


fotoğraf: Nvidia

Llama 3 405B’yi 16.384 Nvidia H100 80GB hızlandırıcı içeren bir küme üzerinde eğitirken, 54 gün boyunca 419 arıza meydana geldi; bu da ortalama her üç saatte bir arıza meydana geliyordu. Vakaların %58,7’sinde ya GPU’lar ya da HBM3 bellekleri suçluydu. Genel olarak, bu tür karmaşık sistemlerdeki başarısızlıklar normdur ve soru daha çok uzmanların bu başarısızlıklarla başa çıkma becerisiyle ilgilidir. Meta* örneğinde ekip etkili eğitim süresinin %90’ından fazlasını kurtardı.

Llama 3 405B sinir ağı eğitim kümesi, yaklaşık altı saatte bir Nvidia H100 hızlandırıcılarının arızalarını kaydetti

Sorunlu GPU’lar özel araçlar kullanılarak belirlendi. Bu araçlar sorunlu iletişimlere öncelik vererek gecikmeli GPU’ların etkili bir şekilde tespit edilmesini ve zamanında çözümlenmesini sağladı ve genel eğitim verimliliğini korurken yavaşlamaların en aza indirilmesini sağladı.

*Meta, Rusya’da aşırılıkçı bir örgüt olarak tanınmakta ve faaliyetleri yasaktır.



genel-22

Motorola Edge 60 Pro’nun sızan görüntülerinin yeni bir düğmenin dahil edilmesine yönelik ipucu olduğu bildirildi
GTFO Konsol Versiyonu 10 Oda Tarafından Hala “Ciddi Olarak” Değerlendiriliyor, Zorluklardan Birini Tartışıyor
Google, Haksız Gelir Paylaşımı Şartları İddialarının Ardından CCİ Tarafından Başka Bir Soruşturmayla Karşı Karşıya
Google Cloud’un görünüşe göre güvenlik duvarlarının bile durduramadığı bir güvenlik sorunu var
İletişimin fiyatı sürekli artacaktır. Rusya, enflasyonun üzerinde tarife artışlarına izin vermeyi planlıyor
ETİKETLENDİ:#nvidia405BağıaltıarızalarınıBirEğitimH100hızlandırıcılarınınkaydettikümesiLlamaMetasaatteSınırYaklaşıkyapay zeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Fortnite iPhone’lara geri dönüyor – bilmeniz gereken her şey
Sonraki Makale Lenovo Xiaoxin Pad Pro 12.7, Dimensity 8300 SoC ile ‘Comfort Edition’ Varyantıyla Birlikte Tanıtıldı

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Apple ile AB Arasındaki Yapay Zeka Hamlesi: Kim İlk Geri Adım Atacak?
Liste
Kritik: XBOW’un Anthropic’in Mythos Önizlemesini Testiyle Güvenlik Açığı
Siber Güvenlik
Apple’ın iOS 27 ve iPadOS 27’deki En İyi Yeni Özellikleri!
Genel
Claude Fable: Bugün herkesin erişebileceği yeni Mythos versiyonu
Yapay Zeka
Elon Musk’ın ilk nesil yörünge veri merkezi uydusu Boeing 747’den geniş
Donanım
Minecraft Hardcore Dünyalarında Hile Yapmak Artık Mümkün Değil
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?