Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Nvidia: H100 AI Performansı, Yazılım Optimizasyonlarıyla Yüzde 54’e Kadar İyileşti
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Nvidia: H100 AI Performansı, Yazılım Optimizasyonlarıyla Yüzde 54’e Kadar İyileşti

Liste

Nvidia: H100 AI Performansı, Yazılım Optimizasyonlarıyla Yüzde 54’e Kadar İyileşti

teknomers
Son güncelleme: 5 Nisan 2023 21:30
teknomers
Paylaş
Paylaş


Nvidia, H100 hesaplama GPU’su için bazı yeni performans sayıları yayınladı. MLPerf 3.0, derin öğrenme iş yükleri için önemli bir kıyaslamanın en son sürümü. Hopper H100 işlemci, eğitim süresi ölçümlerinde yalnızca önceki model A100’ü geride bırakmakla kalmıyor, aynı zamanda yazılım optimizasyonları sayesinde performans kazanıyor. Ayrıca Nvidia, kompakt L4 kompakt bilgi işlem GPU’sunun selefi T4 GPU ile erken performans karşılaştırmalarını da açıkladı.

Nvidia ilk olarak H100 testinde elde ettiği sonuçları yayınladı. MLPerf 2.1 karşılaştırması Eylül 2022’de, amiral gemisi bilgi işlem GPU’sunun çeşitli çıkarım iş yüklerinde selefi A100’ü 4,3-4,4 kata kadar yenebileceğini ortaya çıkardı. MLPerf 3.0’da elde edilen yeni yayınlanan performans rakamları, Nvidia’nın H100’ünün A100’den daha hızlı olduğunu (sürpriz değil) doğrulamakla kalmıyor, aynı zamanda Intel’in yakın zamanda piyasaya sürdüğü Xeon Platinum 8480+ (Sapphire Rapids) işlemcisinden ve NeuChips’ten de somut bir şekilde daha hızlı olduğunu yeniden teyit ediyor. Bir dizi iş yükünde ReccAccel N3000 ve Qualcomm’un Cloud AI 100 çözümleri

Bu iş yükleri arasında görüntü sınıflandırma (ResNet 50 v1.5), doğal dil işleme (BERT Large), konuşma tanıma (RNN-T), tıbbi görüntüleme (3D U-Net), nesne algılama (RetinaNet) ve öneri (DLRM) yer alır. Nvidia, yalnızca GPU’larının daha hızlı olduğunu değil, aynı zamanda makine öğrenimi endüstrisinde daha iyi desteğe sahip olduklarını belirtiyor – bazı iş yükleri rakip çözümlerde başarısız oldu.

Nvidia

(İmaj kredisi: Nvidia)

Yine de Nvidia tarafından yayınlanan rakamlarda bir sorun var. Satıcılar, MLPerf sonuçlarını iki kategoride gönderme seçeneğine sahiptir: kapalı ve açık. Kapalı kategoride, tüm satıcıların matematiksel olarak eşdeğer sinir ağları çalıştırması gerekirken, açık kategoride, donanımlarının performansını optimize etmek için ağları değiştirebilirler. Nvidia’nın rakamları yalnızca kapalı kategoriyi yansıtmaktadır, bu nedenle Intel veya diğer satıcıların donanımlarının performansını optimize etmek için uygulayabilecekleri optimizasyonlar bu grup sonuçlarına yansıtılmaz.

Nvidia’nın kendi örneğinin de gösterdiği gibi, yazılım optimizasyonları modern yapay zeka donanımına büyük faydalar sağlayabilir. Şirketin H100’ü, MLPerf 3.0’a karşı MLPerf 2.1’de öneri iş yüklerinde %7’den nesne algılama iş yüklerinde %54’e yükseldi, ki bu oldukça büyük bir performans artışıdır.

Nvidia

(İmaj kredisi: Nvidia)

Nvidia’da Yapay Zeka, Kıyaslama ve Bulut Direktörü Dave Salvator, ChatGPT ve benzeri hizmetlerin patlamasına atıfta bulunarak bir blog gönderisinde şunları yazıyor: “Yapay zekanın bu iPhone anında, çıkarım performansı hayati önem taşıyor… Derin öğrenme artık neredeyse her yerde konuşlandırıldı ve fabrika zeminlerinden çevrimiçi öneri sistemlerine kadar doymak bilmez bir çıkarım performansı ihtiyacına yol açtı.”

Şirket, H100’ün MLPerf 3.0’da çıkarım performansının kralı olduğunu yeniden teyit etmenin yanı sıra, yakın zamanda piyasaya sürülen AD104 tabanlı L4 hesaplama GPU’su (yeni sekmede açılır). Ada Lovelace destekli bu bilgi işlem GPU kartı, herhangi bir sunucuya sığması için tek yuvalı, düşük profilli bir form faktörü içinde gelir, ancak oldukça müthiş bir performans sunar: genel bilgi işlem için 30,3’e kadar FP32 TFLOPS ve 485’e kadar FP8 TFLOPS (seyreklik ile) ).

Nvidia

(İmaj kredisi: Nvidia)

Nvidia, L4’ünü yalnızca diğer kompakt veri merkezi GPU’larından biri olan T4 ile karşılaştırdı. İkincisi, 2018 Turing mimarisine sahip TU104 GPU’yu temel alır, bu nedenle iş yüküne bağlı olarak yeni GPU’nun MLPerf 3.0’daki öncekinden 2,2–3,1 kat daha hızlı olması şaşırtıcı değildir.

Salvator, “Yıldız yapay zeka performansına ek olarak, L4 GPU’lar 10 kata kadar daha hızlı görüntü kodu çözme, 3,2 kata kadar daha hızlı video işleme ve 4 kattan fazla daha hızlı grafik ve gerçek zamanlı işleme performansı sunuyor” diye yazdı.

Halihazırda büyük sistem üreticileri ve bulut hizmeti sağlayıcıları tarafından sunulan Nvidia’nın H100 ve L4 bilgi işlem GPU’larının kıyaslama sonuçları şüphesiz etkileyici görünüyor. Yine de, bağımsız testler yerine Nvidia’nın kendisi tarafından yayınlanan kıyaslama sayılarıyla uğraştığımızı unutmayın.



genel-21

Galaxy Watch: can sıkıcı aktivite uyarılarını bu şekilde kapatabilirsiniz
Amazon’un ‘dünyada yeni’ bir AR akıllı ev ürünü üzerinde çalıştığı bildiriliyor
AMD, 5nm RDNA 3 Chiplet GPU’nun Çalıştığını Gösterdi
Kızamık salgınları yakında gitmiyor, CDC uyarıyor
Jennifer Lawrence’ın Tüm Komedi Rolleri, Dereceli (Sert Duygular Olmayanlar Dahil)
ETİKETLENDİ:#nvidia54eH100iyileştikadarOptimizasyonlarıylaperformansıYazılımyüzde
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Rusya’da 18 milyon dolara yerli yarış simülatörü yapmak istiyorlar
Sonraki Makale piksel: Pixel 7a rengi, depolama seçenekleri ortaya çıktı: Ne bekleniyor?

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Teknolojinin Gizliliği Kaybettiği Günlere Özlem Duyuluyor
Liste
Trump yönetimi OpenAI’de hisse alabilir mi?
Yapay Zeka
AMD B650 genişletme kartları $199’dan satışa sunuldu: 4 M.2 ve 11 USB portu ekleyin
Donanım
Path of Exile 2 Oynamayı Bırakanlar İçin Şok Gelişme
Oyun
4K Blu-ray’lerde Babalar Günü Öncesi Üç Tane 33 Dolar
Liste
Heyecan Verici Bir Yolculuk: God of War Laufey’in Yönetmeni Taraftarları Bekliyor
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?