OpenAI bugün, karmaşık görevlerden teknolojinin önceki sürümlerine göre daha iyi sorun çözmeye kadar giderek daha karmaşık hale gelen sorunları çözmeye yönelik yeni bir model seti olan o1’i duyurdu. Bu, o1-preview ve o1-mini’yi içeren bu serinin ChatGPT’de ve API’de erken bir önizlemesini temsil ediyor.

“Bu modelleri, tıpkı bir kişinin yapacağı gibi, yanıt vermeden önce sorunlar hakkında düşünmeye daha fazla zaman ayıracak şekilde eğittik. Eğitim yoluyla düşünme süreçlerini iyileştirmeyi, farklı stratejiler denemeyi ve hatalarını fark etmeyi öğreniyorlar.”

Çilek kod adıyla bilinir blogda okuduğumuz gibi o1-preview yeni bir geniş dil modelidir. Karmaşık akıl yürütmeyi gerçekleştirmek için pekiştirmeli öğrenmeyle eğitildi. Ve blogda şöyle yazıyorlar: “o1 yanıt vermeden önce düşünüyor: kullanıcıya yanıt vermeden önce uzun bir iç düşünce zinciri üretebilir.”

«Aslında – okuyoruz – bu modeller, eğitim süreci boyunca, çeşitli olasılıkların kullanılması ve hataların tanınması yoluyla işleme yöntemini iyileştirmeyi öğreniyor». Bu, bir insandan bile daha gelişmiş sorulara ve daha hızlı cevap verdiği anlamına geliyor.

Bir insanın zor bir soruyu yanıtlamadan önce uzun süre düşünebilmesine benzer şekilde, o1 de bir sorunu çözmeye çalışırken düşünce zincirini kullanır. o1, takviyeli öğrenme yoluyla düşünce zincirini geliştirmeyi ve kullandığı stratejileri geliştirmeyi öğrenir. Hatalarını tanımayı ve düzeltmeyi öğrenin. Zor adımları daha basit adımlara ayırmayı öğrenin. Mevcut yaklaşımınız işe yaramadığında farklı bir yaklaşım denemeyi öğrenin.



genel-18