Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: AMD, güçlü gerekçelere sahip ilk 1B parametreli LLM’si AMD OLMo’yu tanıttı
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » AMD, güçlü gerekçelere sahip ilk 1B parametreli LLM’si AMD OLMo’yu tanıttı

Liste

AMD, güçlü gerekçelere sahip ilk 1B parametreli LLM’si AMD OLMo’yu tanıttı

teknomers
Son güncelleme: 6 Kasım 2024 16:58
teknomers
Paylaş
Paylaş


Contents
  • Çok aşamalı ön eğitim
  • Performans sonuçları

AMD’nin sahip olduğu tanıtıldı tamamen açık kaynaklı 1 milyar parametreli büyük dil modellerinin (LLM’ler) ilk serisi AMD OLMo çeşitli uygulamalara yöneliktir ve şirketin Instinct MI250 GPU’ları üzerinde önceden eğitilmiştir. LLM’lerin güçlü akıl yürütme, talimat izleme ve sohbet yetenekleri sunduğu söyleniyor.

AMD’nin açık kaynak yüksek lisansı, şirketin yapay zeka endüstrisindeki konumunu iyileştirmeyi ve müşterilerinin (ve diğer herkesin) bu açık kaynaklı modelleri AMD donanımıyla dağıtmalarını sağlamayı amaçlıyor. AMD, verileri, ağırlıkları, eğitim tariflerini ve kodları açık kaynak olarak kullanarak, geliştiricilerin yalnızca modelleri kopyalamakla kalmayıp aynı zamanda daha fazla yenilik için bunları geliştirmelerine olanak sağlamayı amaçlıyor. AMD, veri merkezlerinde kullanımın ötesinde, OLMo modellerinin sinirsel işlem birimleri (NPU’lar) ile donatılmış AMD Ryzen AI PC’lerinde yerel olarak konuşlandırılmasını sağlayarak geliştiricilerin kişisel cihazlarda AI modellerinden yararlanmasına olanak tanıdı.

Çok aşamalı ön eğitim

AMD OLMo modelleri, her biri dört AMD Instinct MI250 GPU’ya (toplamda 64 işlemci) sahip 16 düğümde 1,3 trilyon tokenden oluşan geniş bir veri kümesi üzerinde eğitildi. AMD’nin OLMo model serisi üç adımda eğitildi.

AMD

(Resim kredisi: AMD)
  • Dolma v1.7’nin bir alt kümesinde önceden eğitilmiş ilk AMD OLMo 1B, dil kalıplarını ve genel bilgiyi yakalamak için sonraki simge tahminine odaklanan, yalnızca kod çözücüye yönelik bir dönüştürücüdür.
  • İkinci versiyon ise AMD OLMo 1B denetimli ince ayarlı (SFT), Tulu V2 veri kümesi (1. aşama) ve ardından OpenHermes-2.5, WebInstructSub ve Code-Feedback veri kümeleri (2. aşama) üzerinde eğitilerek talimat takibini geliştirdi ve geliştirildi. bilim, kodlama ve matematik içeren görevlerdeki performansı.
  • İnce ayarların ardından AMD OLMo 1B SFT modeli, UltraFeedback veri kümesiyle Doğrudan Tercih Optimizasyonu (DPO) kullanılarak insan tercihlerine göre ayarlandı ve böylece tipik insan geri bildirimleriyle uyumlu çıktılara öncelik veren son AMD OLMo 1B SFT DPO sürümü elde edildi.

Performans sonuçları

AMD

(Resim kredisi: AMD)

AMD’nin kendi testlerinde AMD OLMo modelleri, genel muhakeme yetenekleri ve çoklu görev anlayışı açısından standart kıyaslamalarda TinyLlama-1.1B, MobiLlama-1B ve OpenELM-1_1B gibi benzer boyutlu açık kaynaklı modellere karşı etkileyici bir performans gösterdi.

AMD

(Resim kredisi: AMD)

İki aşamalı SFT modeli, MMLU puanlarının %5,09, GSM8k’nin ise %15,32 artmasıyla önemli doğruluk iyileşmeleri kaydetti; bu, AMD’nin eğitim yaklaşımının etkisini gösteriyor. Nihai AMD OLMo 1B SFT DPO modeli, kıyaslamalarda diğer açık kaynaklı sohbet modellerini ortalama en az %2,60 oranında geride bıraktı.

AMD

(Resim kredisi: AMD)

Sohbet kıyaslamalarında AMD OLMo modellerinin talimat ayarlama sonuçları söz konusu olduğunda, özellikle AMD OLMo 1B SFT ve AMD OLMo 1B SFT DPO modellerini diğer talimat ayarlı modellerle karşılaştırırken, AMD’nin modelleri AlpacaEval 2 Kazanma Oranında bir sonraki en iyi rakibini geride bıraktı. +%3,41 ve AlpacaEval 2 LC Kazanma Oranı +%2,29. Ayrıca çok turlu sohbet yeteneklerini ölçen MT-Bench testinde SFT DPO modeli en yakın rakibine göre +%0,97 performans artışı elde etti.

AMD

(Resim kredisi: AMD)

Ek olarak AMD, ToxiGen (toksik dili ölçen ve daha düşük puanın daha iyi olduğu), crows_pairs (önyargıyı değerlendiren) ve TruthfulQA-mc2 (yanıtlardaki doğruluğu değerlendiren) gibi sorumlu yapay zeka kriterlerini de test etti. AMD OLMo modellerinin etik ve sorumlu yapay zeka görevlerini yerine getirme konusunda benzer modellerle aynı seviyede olduğu tespit edildi.

Tom’s Hardware’in en iyi haberlerini ve ayrıntılı incelemelerini doğrudan gelen kutunuza alın.



genel-21

Google’ın bir sonraki büyük katlanabilir cihazı, katlanamayan Pixel 9 ailesiyle daha iyi uyum sağlamak için yeni bir isim alabilir
TikTok, Perşembe günü beta sürümünde Twitch benzeri abonelikler başlatıyor
İtfaiyeciler, telefonunu almaya çalışırken tuvalette kafası ilk sıkışan kadınları kurtardı
Android için WhatsApp, Bağlantılı Cihazlarda Medya Medya Bir kez açma yeteneğini test etmeye başlar
Universal’in En Son Cadılar Bayramı Korku Geceleri Evi Buzlu Bir Hayalet Avcıları Korkusu
ETİKETLENDİ:AMDgerekçelereGüçlüilkLLMsiOLMoyuparametrelisahipTanıttı
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Steam Oyun Kaydı Artık Tüm PC ve Steam Deck Kullanıcıları İçin Yayında
Sonraki Makale İngiliz teknolojisi Trump’ın zaferine tepki gösterdi

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

En İyi Prime Day Dizüstü Bilgisayar Fırsatları: Favorilerim!
Genel
DDR5 ile uygun fiyatlı alternatifler: Ryzen 7 5800X3D bulmak zor
Donanım
2026 Prime Day: Shark, Dyson ve Bissell’de %42’ye Varana Kadar İndirim!
Genel
Onsemi, nakit sıkıntısı çeken Synaptics’i 7 milyar dolara satın aldı
Donanım
Aave ve Solana Fiyat Artışında Lider, Bitcoin 60 Bin Dolar Etrafında Dengelendi
Finans
Trump Yönetimi, Anthropic’in Mythos Modeline Erişimi Artırdı!
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?