Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, Openai’nin O1 nedenlerini nasıl analiz etmek için düşük maliyetli bir açık kaynaklı AI modeli oluşturuyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, Openai’nin O1 nedenlerini nasıl analiz etmek için düşük maliyetli bir açık kaynaklı AI modeli oluşturuyor

Liste

Araştırmacılar, Openai’nin O1 nedenlerini nasıl analiz etmek için düşük maliyetli bir açık kaynaklı AI modeli oluşturuyor

teknomers
Son güncelleme: 6 Şubat 2025 17:02
teknomers
Paylaş
Paylaş



Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, Openai’nin O1 modeliyle performansta karşılaştırılabilir açık kaynaklı bir yapay zeka (AI) modeli geliştirdiler. Araştırmacıların temel amacı, güçlü bir akıl yürütme odaklı model yaratmak değil, San Francisco merkezli AI firmasının O1 Serisi modellerine test süresi ölçeklendirmesi için nasıl talimat verdiğini anlamaktı. Özellikle, araştırmacılar metodolojiyi sergileyebildiler ve çok daha az hesaplama kaynağı kullanırken modelin davranışını son derece düşük bir maliyetle çoğaltabildiler.

Araştırmacılar S1-32B AI modeli geliştirdi

Araştırmacılar, modeli geliştirme metodolojisi ve sürecini detaylandırdılar. çalışmak Baskı öncesi dergi Arxiv’de yayınlandı. İşlem, farklı bir AI modelinden sentetik bir veri kümesi oluşturmayı ve ablasyon ve denetimli ince ayar (SFT) gibi birkaç yeni teknik kullanmayı içeriyordu. Model bir github’da mevcuttur liste.

AI modelinin sıfırdan inşa edilmediğine dikkat edilmelidir. Geliştiriciler Qwen2.5-32b-in-in-in-in-in-in-in-in-in-in-in-in-in-in-somutu kullandı ve S1-32B Büyük Dil Modeli (LLM) oluşturmak için damıtıldı. Eylül 2024’te piyasaya sürülen model yeteneklidir, ancak büyüklüğü ve akıl yürütme yeteneklerinin eksikliği göz önüne alındığında, Openai’nin O1’iyle eşleşemez.

Süreç sırasında araştırmacılar, akıl yürütme izleri ve yanıtları oluşturmak için Gemini Flash Düşünme Uygulama İşleme Arayüzünü (API) kullandılar. API’dan toplam 59.000 üçlü soru, akıl yürütme izleri (düşünce zinciri veya karyolası) ve yanıtlar çıkarıldı. Daha sonra S1K adı verilen bir veri kümesi, 1.000 yüksek kaliteli, çeşitli ve zor soruların yanı sıra akıl yürütme izleri ve yanıtlar seçilerek oluşturuldu.

S1K veri kümesini oluşturduktan sonra, araştırmacılar QWEN2.5-32B-Instruct modelinde denetimli ince ayar yaptılar. Bunun için temel ince ayar hiperparametreleri kullanıldı. Damıtma işlemi 16 NVIDIA H100 GPU’da 26 dakikalık eğitim aldı.

Bu noktaya kadar, araştırmacıların Openai’nin modelleri “düşünmek” ve düşünme sürecini nasıl durdurmayı nasıl başardığı hakkında hiçbir fikri yoktu. Bu olmadan, bir model çıktısını ikinci olarak tahmin ettiği için süresiz olarak fazla düşünme riski taşır.

Modelin ince ayarını yaparken, araştırmacı ilginç bir şey buldu. Ekleyerek çıkarım süresini manipüle edebileceklerini buldular. Ve XML etiketleri. Bir model uç etiketine ulaştığında, son cevap için sesini yetkili bir tona değiştirmesi söylenir. Özellikle, çıkarım süresi, tipik bir AI modelinin ürettiği neredeyse gerçek zamanlı yanıtlardır. Bundan daha fazlası, kodun dikkatli bir şekilde manipülasyonunu gerektirir.

S1-32B modeli ile araştırmacılar, onu normal çıkarım süresinin ötesinde düşünmeye zorlamak için bir “bekleme” komutu eklediler. Eklendikten sonra, model çıktısını ikinci olarak tahmin etmeye ve doğrulamaya başladı. Ardından, etiket bu test süresi ölçekleme aşamasını kısaltmak veya uzatmak için kullanıldı.

Ardından, araştırmacılar ayrıca “alternatif” ve “HMM” gibi diğer birkaç ifadeyi denediler, ancak “bekleme” etiketi kullanılırken en iyi performans metriklerinin elde edildiğini buldular. Araştırmacılar, modeli O1’in performansına yakınlaştırarak, bunun Openai tarafından akıl yürütme modellerine ince ayar yapmak için kullanılan yöntem olabileceğini iddia ediyorlar.

Bir TechCrunch rapor Araştırmacıların S1-32B AI modelini 50 doların altında (kabaca Rs. 4.380) oluşturabildiklerini iddia ederek, akıl yürütme modelleri için eğitim sonrası bir yapı oluşturmanın son derece düşük bir maliyetle yapılabileceğini vurguluyor.



genel-8

Fiyatlar, İçerik Oluşturucu Ayrıntıları ve Daha Fazlası
Samsung Galaxy S26 Note, Galaxy S26 Pro’nun Ultra ve Plus Adlandırma Şemasının Yerini Alacağını İddia Ediyor
Starlink mobil cihazlar için yeni uyduları yörüngeye yerleştiriyor – Siècle Digital
Finansal hizmet şirketlerinin yalnızca dörtte biri İngiltere’nin bir kripto merkezi olmasını istiyor
Evde kullandığım bu Samsung soundbar %54 indirimli ve kesinlikle satın alınması gereken bir ürün
ETİKETLENDİ:AçıkAI modeliAnalizAraştırmacılarBirdüşükEtmekiçinkaynaklıMaliyetlimodelinasılNedenleriniOluşturuyorOpenAIOpenAIninS1 32B AI Model Openai O1 Akıl Yürütme Düşük Maliyet Geliştirilen Stanford Washington Üniversitesi AIyapay zeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Artık giriş yapmadan chatgpt web aramasını kullanabilirsiniz.
Sonraki Makale Onaylandı: VW’den e-araba 20.000 Euro için geliyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Yeni Star Fox Projesi: Kimlerin Yer Aldığını Öğrenince Heyecanlandım
Oyun
Meta’nın Kritik Kararı: İş Verilerini AI Kişiselleştirmede Kullanacak!
Siber Güvenlik
Acil: Microsoft Haziran 2026 Yamanı 3 Sıfır Gün Açığı ve 200 Hata Düzeltiyor
Siber Güvenlik
MacOS 27 Golden Gate: Yeni Özellikler ve Öne Çıkan Yenilikler
Genel
CISA, FBI ve Devlet Kurumlarına VPN Açığını Üç Günde Kapatma Talimatı Verdi
Genel
Fitbit Charge 6 ve Ace LTE Yeni $100’lık Air ile Aynı Fiyatta
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?