Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Hugging Face, Test Süresinde Bilgi İşlem Ölçeklendirmesinin SLM’lerin Daha Büyük Yapay Zeka Modellerinden Daha İyi Performans Göstermesine Nasıl Yardımcı Olduğunu Gösteriyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Hugging Face, Test Süresinde Bilgi İşlem Ölçeklendirmesinin SLM’lerin Daha Büyük Yapay Zeka Modellerinden Daha İyi Performans Göstermesine Nasıl Yardımcı Olduğunu Gösteriyor

Liste

Hugging Face, Test Süresinde Bilgi İşlem Ölçeklendirmesinin SLM’lerin Daha Büyük Yapay Zeka Modellerinden Daha İyi Performans Göstermesine Nasıl Yardımcı Olduğunu Gösteriyor

teknomers
Son güncelleme: 24 Aralık 2024 16:09
teknomers
Paylaş
Paylaş



Hugging Face, geçen hafta küçük dil modellerinin (SLM’ler) daha büyük modellerden nasıl daha iyi performans gösterebileceğini gösteren yeni bir vaka çalışmasını paylaştı. Gönderide platformun araştırmacıları, yapay zeka (AI) modellerinin eğitim süresini artırmak yerine test süresi hesaplamasına odaklanmanın, AI modelleri için gelişmiş sonuçlar gösterebileceğini iddia etti. İkincisi, yapay zeka modellerinin bir sorunu çözmek için daha fazla zaman harcamasına olanak tanıyan ve kendi kendini geliştirme ve verimliliklerini artırabilecek bir doğrulayıcıya karşı arama yapma gibi farklı yaklaşımlar sunan bir çıkarım stratejisidir.

Test Süresinde Bilgi İşlem Ölçeklendirmesi Nasıl Çalışır?

bir postalamakHugging Face, bir yapay zeka modelinin yeteneklerini geliştirmeye yönelik geleneksel yaklaşımın genellikle kaynak yoğun ve son derece pahalı olabileceğini vurguladı. Tipik olarak, eğitim öncesi veri ve algoritmaların, temel modelin bir sorguyu parçalama ve çözüme ulaşma şeklini iyileştirmek için kullanıldığı, eğitim zamanı hesaplaması adı verilen bir teknik kullanılır.

Alternatif olarak araştırmacılar, yapay zeka modellerinin bir sorunu çözmek için daha fazla zaman harcamasına ve kendilerini düzeltmelerine olanak tanıyan bir teknik olan test süresi hesaplama ölçeklendirmesine odaklanmanın da benzer sonuçlar gösterebileceğini iddia etti.

OpenAI’nin test süresi hesaplamasını kullanan o1 muhakeme odaklı modelinin örneğini vurgulayan araştırmacılar, bu tekniğin, eğitim verilerinde veya ön eğitim yöntemlerinde herhangi bir değişiklik yapılmamasına rağmen yapay zeka modellerinin gelişmiş yetenekler sergilemesine izin verebileceğini belirtti. Ancak bir sorun vardı. Çoğu akıl yürütme modeli kapalı olduğundan, kullanılan stratejileri bilmenin bir yolu yoktur.

Araştırmacılar, LLM geliştiricilerinin eğitim sonrası aşamada test süresi hesaplamasını tam olarak nasıl ölçeklendirebileceğini ortaya çıkarmak için Google DeepMind tarafından yapılan bir çalışmayı ve tersine mühendislik tekniklerini kullandı. Vaka çalışmasına göre, yalnızca işlem süresinin arttırılması, karmaşık sorguların çıktılarında önemli bir iyileşme göstermemektedir.

Bunun yerine araştırmacılar, yapay zeka modellerinin sonraki yinelemelerdeki yanıtları değerlendirmesine ve potansiyel hataları belirleyip düzeltmesine olanak tanıyan bir kendi kendini iyileştirme algoritmasının kullanılmasını öneriyor. Ek olarak, modellerin arama yapabileceği bir doğrulayıcının kullanılması yanıtları daha da iyileştirebilir. Bu tür doğrulayıcılar, öğrenilmiş bir ödül modeli veya sabit kodlanmış buluşsal yöntem olabilir.

Daha gelişmiş teknikler, bir modelin problem başına birden fazla yanıt ürettiği ve hangisinin daha uygun olduğuna karar vermek için bir puan atadığı N’nin en iyisi yaklaşımını içerecektir. Bu tür yaklaşımlar bir ödül modeliyle eşleştirilebilir. Adım adım akıl yürütmeye ve her adım için puan atamaya öncelik veren ışın arama, araştırmacıların vurguladığı bir diğer stratejidir.

Hugging Face araştırmacıları yukarıda bahsedilen stratejileri kullanarak Llama 3B SLM’yi kullanabildiler ve MATH-500 testinde çok daha büyük bir model olan Llama 70B’den daha iyi performans göstermelerini sağladılar.



genel-8

O zamana kadar kültürel köklerimle bağlantı kurmama yardımcı oldu
O kötü King Kong oyunu yalnızca bir yıldır geliştiriliyordu
Musk: SpaceX’in Starlink’i başa baş nakit akışına ulaştı
Meta’nın Orion’un eski donanım lideri OpenAI’ye katılıyor
Google’ın “karanlık kalıpları”, kullanıcıları kişisel verileri ifşa etmeleri için kandırır; 392 milyon dolarlık dava sonuçlandı
ETİKETLENDİ:bilgibüyükDahaFaceGösteriyorGöstermesineHuggingişlemiyiLamamodellerindennasılÖlçeklendirmesininOlduğunuperformansSarılma yüzü test süresi hesaplama ölçeklendirmesi küçük dil modelleri llms'den daha iyi performans gösteriyor Sarılma yüzüSLMlerinSüresindetestYapayyapay zekayardımcıZeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Fractured Alliance, Red Alert 2’den ilham alan yeni bir Command and Conquer hissi veriyor
Sonraki Makale Google Cüzdan, Noel öncesinde bir düzineden fazla ABD bankası için destek alıyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Yeni Kahraman Cyberpunk Temalı Bir Şeytan Olacak
Oyun
Acil: Claude Fable 5 Sınırlı Süreyle Kullanıma Sunuldu!
Siber Güvenlik
2026 Yılında Geçerli Kriptopara Kurtarma Şirketi: Viste_ZEUS KRİPTO KURTARMA HİZMETLERİ
Yazılım
Justin Ernest’in geleneksel VC olmadan 500M$ yatırımı nasıl yaptı?
Yapay Zeka
Google AI Abonelik Fiyat Savaşlarında Uyarı Verdi
Genel
Destiny 2 Oyuncu Sayısında Rekor Artış, Son Güncelleme Heyecanı
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?