OpenAI Perşembe günü yeni o1 serisi yapay zeka (AI) modellerini yayınladı. AI firması bu akıl yürütme modellerini matematiksel ve karmaşık akıl yürütme tabanlı problemleri çözmedeki gelişmiş yetenekleri nedeniyle adlandırıyor. İki model var — önizlemede bulunan o1 ve o1-mini. Şirket, bu AI modellerinin insanlara benzer şekilde yanıt vermeden önce düşünmek için zaman harcamak üzere eğitildiğini söyledi. Özellikle, bunun Strawberry olduğu bildirilen AI modeliyle aynı olduğuna inanılıyor.
OpenAI o1 Serisi AI Modelleri Yayımlandı
Bir blog yazısında, AI firması tanıtıldı gelişmiş muhakeme yeteneklerine sahip yeni AI modelleri. Bu modeller, tüm istemi tek seferde işlemediği ve bunun yerine problemi sistematik olarak ele aldığı için standart üretken AI’dan farklıdır, tıpkı insanların yaptığı gibi. Bu ayrıca AI modelinin farklı stratejileri denemesine ve olası hataları düzeltmesine olanak tanır. OpenAI, bu modellerin düşünmek için fazladan bir an harcadıkları için GPT-4o modelinden daha yavaş olduğunu vurgular.
OpenAI o1 bozuk bir cümleyi çevirir. resim.twitter.com/E37e4SOuq4
— OpenAI (@OpenAI) 12 Eylül 2024
Peki, bu ortalama bir kullanıcı için ne anlama geliyor? Kullanıcılar, yapay zekaya genellikle çok seviyeli muhakeme ve eleştirel değerlendirme gerektiren karmaşık sorgular sorabilecekler. Örneğin, “Şu seriye bakın: 12, 11, 13, 12, 14, 13, … Sırada hangi sayı olmalı?” gibi çok adımlı düşünme gerektiren bir soru artık yapay zeka tarafından doğru bir şekilde çözülebilir.
Bir adam kütüphaneye girer ve kütüphaneciden bir kitap ister. Kütüphaneci belirli bir rafı işaret eder. Adam kadına teşekkür eder ve kitap almadan çıkar. Neden?
OpenAI, o1-preview modelinin fizik, kimya ve biyoloji konularındaki sorulara yanıt verirken doktora öğrencilerininkine benzer bir seviyede performans gösterdiğini iddia etti. Model ayrıca matematik problemlerini çözmede de benzer çıktılar gösteriyor. Gönderide, “Uluslararası Matematik Olimpiyatı (IMO) için bir yeterlilik sınavında, GPT-4o problemlerin yalnızca yüzde 13’ünü doğru bir şekilde çözerken, muhakeme modeli yüzde 83 puan aldı” denildi.
OpenAI’nin CEO’su Sam Altman, X’te (eski adıyla Twitter) vurgulandı postalamak o1 modellerinin doktora düzeyindeki bilim ölçütü GPQA Diamond’da 78,3 puan alabildiğini söyledi. Ancak, büyük dil modelinin (LLM) hala kusurlu olduğunu çünkü modelin yeni bir versiyonu olduğunu ekledi. OpenAI, bunu tutarlı bir şekilde iyileştirmek için güncellemeler yayınlamayı planlıyor.
Şimdilik, o1 serisi AI modelleri ChatGPT Plus ve Team kullanıcıları için önizlemede mevcut olacak. Ancak, o1 için haftalık 30 mesaj ve o1-mini için 50 mesajlık bir hız sınırı var. Şirket, bu sınırların gelecekte artırılabileceğini vurguladı. Hız sınırlarının uygulanmasının nedenlerinden biri, modellerin standart trafo tabanlı mimariye kıyasla çalıştırılmasının daha pahalı olmasıdır.
Uygun geliştiriciler ayrıca dakikada 20 istek (RPM) oranı sınırıyla yeni AI modellerini kullanabilecekler. Ancak geliştiriciler bunu işlev çağrısı, akış, sistem mesajları desteği ve daha fazlası için kullanamayacaklar. Ayrıca, ChatGPT Enterprise ve Edu kullanıcıları önümüzdeki hafta modellere erişebilecekler.
ChatGPT’nin ücretsiz katmanındaki kullanıcılar yakında o1-mini AI modeline erişebilecekler, ancak bunun da GPT-4o’dan daha düşük bir hız sınırıyla gelmesi bekleniyor.