Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: NVIDIA TensorRT-LLM, Büyük Dil Modellerini Olağanüstü Şekilde Artırıyor, Hopper GPU’larda 8 Kat’a Kadar Kazanç
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » NVIDIA TensorRT-LLM, Büyük Dil Modellerini Olağanüstü Şekilde Artırıyor, Hopper GPU’larda 8 Kat’a Kadar Kazanç

Genel

NVIDIA TensorRT-LLM, Büyük Dil Modellerini Olağanüstü Şekilde Artırıyor, Hopper GPU’larda 8 Kat’a Kadar Kazanç

teknomers
Son güncelleme: 9 Eylül 2023 16:13
teknomers
Paylaş
Paylaş


NVIDIA bugün TensorRT LLM olarak bilinen ve GPU’larındaki Büyük Dil Modellerinin performansını artıran yepyeni bir AI yazılım yığınını duyuruyor.

NVIDIA TensorRT-LLM, Hopper AI GPU’larda Büyük Dil Modeli Performansında 8 Kat’a Kadar Kazanç Sağlıyor

NVIDIA’nın TensorRT-LLM’si, NVIDIA’nın Hopper gibi AI GPU’ları ile tüm Büyük Dil Modellerinde en hızlı çıkarım performansını sağlayan, yüksek oranda optimize edilmiş, açık kaynaklı bir kitaplık olarak duyuruldu. NVIDIA, SmoothQuant, FlashAttention ve fMHA gibi en ileri tekniklere sahip en yeni AI çekirdeklerini kullanarak GPU’larını optimize etmek için açık kaynak topluluğu içindeki tüm Yüksek Lisans’larla birlikte çalıştı. Açık kaynak temeli, yalnızca birkaçını saymak gerekirse GPT-3 (175B), Llama Falcom (180B) ve Bloom gibi LLM’lerin çalıştırmaya hazır SOTA çıkarımı için optimize edilmiş sürümlerini içerir.

TensorRT-LLM ayrıca Infiniband ara bağlantısıyla birden fazla NVLINK sunucusu arasında otomatik paralelleştirme yapacak şekilde optimize edilmiştir. Daha önce, sunuculara birden fazla sunucu/GPU genelinde büyük bir dil modelinin manuel olarak atanması gerekiyordu; bu durum artık Tensor-RT LLM’de geçerli olmamalıdır.

TensorRT-LLM’nin getirdiği en büyük güncellemelerden biri, Uçuş İçi toplu işlem olarak bilinen ve işin diğer görevlerden bağımsız olarak GPU’ya girip çıkmasına olanak tanıyan yeni bir zamanlayıcı biçimindedir. Aynı GPU’da yoğun işlem gerektiren büyük istekleri işlerken birden fazla küçük sorgunun dinamik olarak işlenmesine olanak tanır. Tüm bu süreç GPU’yu daha verimli hale getiriyor ve H100 gibi GPU’larda verimlilikte tam olarak 2 katına kadar bazı büyük kazanımlara yol açıyor.

TensorRT-LLM yığını ayrıca Hopper’ın Transformer motoru ve hesaplama FP8 yetenekleri çerçevesinde optimize edilmiştir. Kitaplık, otomatik FP8 dönüştürme, çekirdek füzyonu için bir DL derleyici ve karma hassasiyet iyileştiricinin yanı sıra doğruluk kaybı olmadan 8 bit niceleme performansı sağlayan NVIDIA’nın kendi Smoothquaint algoritmasını destekler.

Performans rakamlarına gelecek olursak NVIDIA, A100’ü H100’ün ağustos ayındaki performansıyla ve H100’ün TensorRT-LLM performansını karşılaştırıyor. GPT-J 6B’de (Çıkarım) H100 zaten 4 kat kazanç sunuyordu ancak TensorRT-LLM ile şirket performansı iki katına çıkararak bu özel testte 8 kat kazanç elde etti. Llama2’de TensorRT LLM ile 5 kata kadar, TensorRT-LLM olmadan standart H100’e göre neredeyse 2 kata kadar kazanç görüyoruz.

NVIDIA, Meta, Grammarly, Deci, anyscale vb. gibi önde gelen tüm çıkarım iş yükleriyle çalıştıklarını belirtiyor. TensorRT-LLM’yi kullanarak Yüksek Lisanslarını hızlandırmak için. Kullanılabilirliğe gelince, TensorRT-LLM şu anda erken erişimde ve önümüzdeki ay tam sürümünün yayınlanması bekleniyor. Desteğe gelince, TensorRT-LLM, bugün üretimde olan A100, H100, L4, L40, L40S, HGX, Grace Hopper ve benzeri tüm NVIDIA Veri Merkezi ve AI GPU’ları tarafından desteklenecektir.

Bu hikayeyi paylaş

Facebook

heyecan



genel-17

Facebook, 2018’de 12’den Fazla Veri İhlalinden 18,6 Milyon Dolarlık GDPR Cezası Aldı
Star Wars Dark Forces Remaster 28 Şubat 2024’te Geliyor
3/4/23 Haftası için Anime ve Manga Hızlı Nabız
Yeni DeepSeek Yapay Zeka Modeli Ortaya Çıktıktan Sonra Nvidia Hisse Fiyatı Devasa Düştü
Factorio 6 yılda 3,1 milyon satışı geçti
ETİKETLENDİ:#nvidiaArtırıyorbüyükdilGPUlardaHopperkadarkataKazançModelleriniolağanüstüşekildeTensorRTLLM
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Milyonlarca Kişi, Google Play’deki Sahte Telegram Uygulamalarında Gizlenen Casus Yazılımlardan Etkilendi
Sonraki Makale En iyi Fransızca yazım denetleyicisini kullanarak akıcı, hatasız metinler yazın — Siècle Digital

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Büyüleyici Kardeş: Vampire Survivors’a Eklenen Yeni DLC ile Yenilikler Kapıda
Oyun
Laravel ile 3 Satır Kodla WhatsApp Mesajı Gönderin
Yazılım
AION 2’nin Çıkış Tarihi Yaz Oyun Festivali’nde Duyuruldu
Oyun
OpenAI Hassas Verileri Koruma İçin Lockdown Modunu Tanıttı
Genel
RAM fiyatları yıl sonuna kadar iki katına çıkacak, indirimler eski stokları eritmekten kaynaklanıyor
Donanım
Meta Kendi Yapay Zeka Tabanlı Tıklama Tuzağı Haber Akışını Yaratıyor
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?