Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: NVIDIA TensorRT-LLM, Büyük Dil Modellerini Olağanüstü Şekilde Artırıyor, Hopper GPU’larda 8 Kat’a Kadar Kazanç
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » NVIDIA TensorRT-LLM, Büyük Dil Modellerini Olağanüstü Şekilde Artırıyor, Hopper GPU’larda 8 Kat’a Kadar Kazanç

Genel

NVIDIA TensorRT-LLM, Büyük Dil Modellerini Olağanüstü Şekilde Artırıyor, Hopper GPU’larda 8 Kat’a Kadar Kazanç

teknomers
Son güncelleme: 9 Eylül 2023 16:13
teknomers
Paylaş
Paylaş


NVIDIA bugün TensorRT LLM olarak bilinen ve GPU’larındaki Büyük Dil Modellerinin performansını artıran yepyeni bir AI yazılım yığınını duyuruyor.

NVIDIA TensorRT-LLM, Hopper AI GPU’larda Büyük Dil Modeli Performansında 8 Kat’a Kadar Kazanç Sağlıyor

NVIDIA’nın TensorRT-LLM’si, NVIDIA’nın Hopper gibi AI GPU’ları ile tüm Büyük Dil Modellerinde en hızlı çıkarım performansını sağlayan, yüksek oranda optimize edilmiş, açık kaynaklı bir kitaplık olarak duyuruldu. NVIDIA, SmoothQuant, FlashAttention ve fMHA gibi en ileri tekniklere sahip en yeni AI çekirdeklerini kullanarak GPU’larını optimize etmek için açık kaynak topluluğu içindeki tüm Yüksek Lisans’larla birlikte çalıştı. Açık kaynak temeli, yalnızca birkaçını saymak gerekirse GPT-3 (175B), Llama Falcom (180B) ve Bloom gibi LLM’lerin çalıştırmaya hazır SOTA çıkarımı için optimize edilmiş sürümlerini içerir.

TensorRT-LLM ayrıca Infiniband ara bağlantısıyla birden fazla NVLINK sunucusu arasında otomatik paralelleştirme yapacak şekilde optimize edilmiştir. Daha önce, sunuculara birden fazla sunucu/GPU genelinde büyük bir dil modelinin manuel olarak atanması gerekiyordu; bu durum artık Tensor-RT LLM’de geçerli olmamalıdır.

TensorRT-LLM’nin getirdiği en büyük güncellemelerden biri, Uçuş İçi toplu işlem olarak bilinen ve işin diğer görevlerden bağımsız olarak GPU’ya girip çıkmasına olanak tanıyan yeni bir zamanlayıcı biçimindedir. Aynı GPU’da yoğun işlem gerektiren büyük istekleri işlerken birden fazla küçük sorgunun dinamik olarak işlenmesine olanak tanır. Tüm bu süreç GPU’yu daha verimli hale getiriyor ve H100 gibi GPU’larda verimlilikte tam olarak 2 katına kadar bazı büyük kazanımlara yol açıyor.

TensorRT-LLM yığını ayrıca Hopper’ın Transformer motoru ve hesaplama FP8 yetenekleri çerçevesinde optimize edilmiştir. Kitaplık, otomatik FP8 dönüştürme, çekirdek füzyonu için bir DL derleyici ve karma hassasiyet iyileştiricinin yanı sıra doğruluk kaybı olmadan 8 bit niceleme performansı sağlayan NVIDIA’nın kendi Smoothquaint algoritmasını destekler.

Performans rakamlarına gelecek olursak NVIDIA, A100’ü H100’ün ağustos ayındaki performansıyla ve H100’ün TensorRT-LLM performansını karşılaştırıyor. GPT-J 6B’de (Çıkarım) H100 zaten 4 kat kazanç sunuyordu ancak TensorRT-LLM ile şirket performansı iki katına çıkararak bu özel testte 8 kat kazanç elde etti. Llama2’de TensorRT LLM ile 5 kata kadar, TensorRT-LLM olmadan standart H100’e göre neredeyse 2 kata kadar kazanç görüyoruz.

NVIDIA, Meta, Grammarly, Deci, anyscale vb. gibi önde gelen tüm çıkarım iş yükleriyle çalıştıklarını belirtiyor. TensorRT-LLM’yi kullanarak Yüksek Lisanslarını hızlandırmak için. Kullanılabilirliğe gelince, TensorRT-LLM şu anda erken erişimde ve önümüzdeki ay tam sürümünün yayınlanması bekleniyor. Desteğe gelince, TensorRT-LLM, bugün üretimde olan A100, H100, L4, L40, L40S, HGX, Grace Hopper ve benzeri tüm NVIDIA Veri Merkezi ve AI GPU’ları tarafından desteklenecektir.

Bu hikayeyi paylaş

Facebook

heyecan



genel-17

Overwatch Dev Ekibi Fortnite Tarzı Geçişleri Keşfetmekle İlgileniyor
Apple Watch, watchOS 10 ile büyük değişiklikler görebilir
Yeni uygun fiyatlı Redmi 11A neler yapabilir? Akıllı telefonun özelliklerini açıkladı
Önümüzdeki yıldan itibaren SpaceX oyuncaklarını ve koleksiyonlarını satın alabilirsiniz.
iDropNews: iPhone 14 sunumu 13 Eylül’de gerçekleşecek
ETİKETLENDİ:#nvidiaArtırıyorbüyükdilGPUlardaHopperkadarkataKazançModelleriniolağanüstüşekildeTensorRTLLM
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Milyonlarca Kişi, Google Play’deki Sahte Telegram Uygulamalarında Gizlenen Casus Yazılımlardan Etkilendi
Sonraki Makale En iyi Fransızca yazım denetleyicisini kullanarak akıcı, hatasız metinler yazın — Siècle Digital

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Akıllı Ev Endüstrisi Matter İçin Neden Hala Bahis Oynuyor?
Liste
Bambu Lab A2L 3D Yazıcı İncelemesi: A1’in Gelişimi
Donanım
Jujutsu Legacy Dünyasında Yeni Kodlarla Sürprizler Seni Bekliyor
Oyun
Acil: GPT-5.6 Sol’un Kısıtlı Erişimi ve Güçlü Siber Önlemleri
Siber Güvenlik
Yeni En İyi Akıllı Hoparlör Olabilir Mi?
Liste
DeleteMe Gerçekten Bilgilerinizi İnternetten Silinmesini Sağlıyor Mu?
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?