Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, Openai’nin O1 nedenlerini nasıl analiz etmek için düşük maliyetli bir açık kaynaklı AI modeli oluşturuyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, Openai’nin O1 nedenlerini nasıl analiz etmek için düşük maliyetli bir açık kaynaklı AI modeli oluşturuyor

Liste

Araştırmacılar, Openai’nin O1 nedenlerini nasıl analiz etmek için düşük maliyetli bir açık kaynaklı AI modeli oluşturuyor

teknomers
Son güncelleme: 6 Şubat 2025 17:02
teknomers
Paylaş
Paylaş



Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, Openai’nin O1 modeliyle performansta karşılaştırılabilir açık kaynaklı bir yapay zeka (AI) modeli geliştirdiler. Araştırmacıların temel amacı, güçlü bir akıl yürütme odaklı model yaratmak değil, San Francisco merkezli AI firmasının O1 Serisi modellerine test süresi ölçeklendirmesi için nasıl talimat verdiğini anlamaktı. Özellikle, araştırmacılar metodolojiyi sergileyebildiler ve çok daha az hesaplama kaynağı kullanırken modelin davranışını son derece düşük bir maliyetle çoğaltabildiler.

Araştırmacılar S1-32B AI modeli geliştirdi

Araştırmacılar, modeli geliştirme metodolojisi ve sürecini detaylandırdılar. çalışmak Baskı öncesi dergi Arxiv’de yayınlandı. İşlem, farklı bir AI modelinden sentetik bir veri kümesi oluşturmayı ve ablasyon ve denetimli ince ayar (SFT) gibi birkaç yeni teknik kullanmayı içeriyordu. Model bir github’da mevcuttur liste.

AI modelinin sıfırdan inşa edilmediğine dikkat edilmelidir. Geliştiriciler Qwen2.5-32b-in-in-in-in-in-in-in-in-in-in-in-in-in-in-somutu kullandı ve S1-32B Büyük Dil Modeli (LLM) oluşturmak için damıtıldı. Eylül 2024’te piyasaya sürülen model yeteneklidir, ancak büyüklüğü ve akıl yürütme yeteneklerinin eksikliği göz önüne alındığında, Openai’nin O1’iyle eşleşemez.

Süreç sırasında araştırmacılar, akıl yürütme izleri ve yanıtları oluşturmak için Gemini Flash Düşünme Uygulama İşleme Arayüzünü (API) kullandılar. API’dan toplam 59.000 üçlü soru, akıl yürütme izleri (düşünce zinciri veya karyolası) ve yanıtlar çıkarıldı. Daha sonra S1K adı verilen bir veri kümesi, 1.000 yüksek kaliteli, çeşitli ve zor soruların yanı sıra akıl yürütme izleri ve yanıtlar seçilerek oluşturuldu.

S1K veri kümesini oluşturduktan sonra, araştırmacılar QWEN2.5-32B-Instruct modelinde denetimli ince ayar yaptılar. Bunun için temel ince ayar hiperparametreleri kullanıldı. Damıtma işlemi 16 NVIDIA H100 GPU’da 26 dakikalık eğitim aldı.

Bu noktaya kadar, araştırmacıların Openai’nin modelleri “düşünmek” ve düşünme sürecini nasıl durdurmayı nasıl başardığı hakkında hiçbir fikri yoktu. Bu olmadan, bir model çıktısını ikinci olarak tahmin ettiği için süresiz olarak fazla düşünme riski taşır.

Modelin ince ayarını yaparken, araştırmacı ilginç bir şey buldu. Ekleyerek çıkarım süresini manipüle edebileceklerini buldular. Ve XML etiketleri. Bir model uç etiketine ulaştığında, son cevap için sesini yetkili bir tona değiştirmesi söylenir. Özellikle, çıkarım süresi, tipik bir AI modelinin ürettiği neredeyse gerçek zamanlı yanıtlardır. Bundan daha fazlası, kodun dikkatli bir şekilde manipülasyonunu gerektirir.

S1-32B modeli ile araştırmacılar, onu normal çıkarım süresinin ötesinde düşünmeye zorlamak için bir “bekleme” komutu eklediler. Eklendikten sonra, model çıktısını ikinci olarak tahmin etmeye ve doğrulamaya başladı. Ardından, etiket bu test süresi ölçekleme aşamasını kısaltmak veya uzatmak için kullanıldı.

Ardından, araştırmacılar ayrıca “alternatif” ve “HMM” gibi diğer birkaç ifadeyi denediler, ancak “bekleme” etiketi kullanılırken en iyi performans metriklerinin elde edildiğini buldular. Araştırmacılar, modeli O1’in performansına yakınlaştırarak, bunun Openai tarafından akıl yürütme modellerine ince ayar yapmak için kullanılan yöntem olabileceğini iddia ediyorlar.

Bir TechCrunch rapor Araştırmacıların S1-32B AI modelini 50 doların altında (kabaca Rs. 4.380) oluşturabildiklerini iddia ederek, akıl yürütme modelleri için eğitim sonrası bir yapı oluşturmanın son derece düşük bir maliyetle yapılabileceğini vurguluyor.



genel-8

Yeni Oyuncular, Lig Oyunu ve Daha Fazlası İçin Eleme Şehri İpuçları
Sekme uygulaması incelemesi: brunch faturalarını bölmek basitleştirildi
AirPods, AirPods Pro 2’den sonra Lightning bağlantı noktasını kaybetmek için eğildi
Bluesky birisinin adınızı çalmasını zorlaştırdı ancak doğrulama hâlâ zorlu bir iş
Netflix, Parola Paylaşımı Yapan ABD Müşterilerini Uyarıyor
ETİKETLENDİ:AçıkAI modeliAnalizAraştırmacılarBirdüşükEtmekiçinkaynaklıMaliyetlimodelinasılNedenleriniOluşturuyorOpenAIOpenAIninS1 32B AI Model Openai O1 Akıl Yürütme Düşük Maliyet Geliştirilen Stanford Washington Üniversitesi AIyapay zeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Artık giriş yapmadan chatgpt web aramasını kullanabilirsiniz.
Sonraki Makale Onaylandı: VW’den e-araba 20.000 Euro için geliyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Tek Sorumluluk Prensibi (SRP) – DEV Community
Yazılım
İnternetin Babası Emekli Olmaya Hazırlanıyor
Genel
Trump, Anthropic’ın Mythos ve Fable Modellerine Kısıtlama Getirmedi
Genel
Popüler Duvar Kağıdı Uygulaması Malware Endişesiyle Kaldırıldı
Oyun
Wayve 85M Dolar Çalışan Teklifini 8.5M Milyar Dolar Değerleme ile Başlattı
Genel
Acil: Anthropic, Claude Fable Erişimini Çarşamba Günü Yeniden Açıyor
Siber Güvenlik
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?