OpenAI’nın Yeni Açık Ağırlık Modeli: GPT-OSS
OpenAI, özgür olarak indirilebilen, özelleştirilebilen ve hatta bir dizüstü bilgisayarda çalıştırılabilen yeni bir açık ağırlık modeli olan GPT-OSS‘yi duyurdu. Bu modelin iki farklı versiyonu mevcut: 120 milyar parametreli ve 20 milyar parametreli. Daha büyük versiyon, tek bir Nvidia GPU üzerinde çalışabilirken, mevcut o4-mini modeliyle benzer performans sergiliyor. Daha küçük olan versiyon ise o3-mini ile benzer performans gösteriyor ve sadece 16GB bellekle çalışabiliyor. Her iki model versiyonu da Hugging Face, Databricks, Azure ve AWS gibi platformlar aracılığıyla Apache 2.0 lisansı altında yayımlanıyor. Bu lisans, modellerin ticari amaçlarla geniş bir şekilde özelleştirilmesine olanak tanıyor.
Açık Ağırlık Modellerinin Önemi
OpenAI’nin bu model üzerindeki çalışmaları, altı yıldan fazla bir süre sonunda piyasaya sunulan ilk açık ağırlık modeli olma özelliğini taşıyor. Bu, ChatGPT’nin piyasaya sürülmesinden çok önce gerçekleşti. Önceki dönemlerde, CEO Sam Altman, güvenlik endişelerini, açık modellerin yayımlanmaması için en önemli neden olarak göstermişti. Ancak son zamanlarda, geliştiricilerin açık modellere ilgi göstermesi, bu modellerin daha düşük maliyetli ve özelleştirilebilir olmalarından kaynaklanıyor. Altman, ocak ayında DeepSeek‘in yükselişinin ardından, OpenAI’nin kendi açık modellerini yayımlamamanın geçmişteki bir hataları olduğunu belirtti.
GPT-OSS’nin Performansı
OpenAI, GPT-OSS’nin mantıksal düşünme görevlerini yerine getirebildiğini, web üzerinde dolaşabildiğini, kod yazabildiğini ve mevcut API’ler aracılığıyla ajansları çalıştırabildiğini belirtiyor. OpenAI araştırmacısı Chris Cook, medya brifinginde, “Birçok kişinin müşterilerimizin çoğunun zaten çok sayıda açık model kullandığını bilmekten şaşırdığını düşünüyorum” dedi. “Biz de bu boşluğu doldurmak ve teknolojimizi genel olarak kullanılabilir hale getirmek istedik.”
Güvenlik ve Test Süreçleri
Güvenlik açısından, OpenAI, GPT-OSS’nin bugüne kadar oluşturduğu en kapsamlı test süreçlerinden geçirildiğini belirtti. Modelin, siber güvenlik ve biyolojik silahlar gibi alanlarda risk teşkil etmediğinden emin olmak için dış güvenlik firmaları ile test edildi. Modelin “düşünme zinciri” ya da bir cevaba ulaşma sürecinin görünür şekilde sunulması, modelin kötüye kullanımıyla ilgili sorunların izlenmesine yardımcı oluyor. Bu süreç sayesinde yanlış davranışlar, aldatma ve kötüye kullanım durumları gözlemlenebiliyor.
Benchmarking ve Diğer Modellerle Karşılaştırma
OpenAI, GPT-OSS’nin Llama, DeepSeek veya Google‘ın Gemma gibi diğer açık modellerle kıyaslandığı benchmarkları paylaşmamış olsa da, her iki versiyon da OpenAI’nin kapalı mantık modelleri ile benzer performans sunuyor. Özellikle kodlama görevleri ve Humanity’s Last Exam gibi testlerde etkileyici sonuçlar elde ediyor. OpenAI’nin kurucu ortağı Greg Brockman, “Bu harika modeller,” diyerek, “Ekibimiz burada gerçekten çok çalıştı” ifadesini kullandı.
Gelecek için Beklentiler
OpenAI, gelecekteki GPT-OSS sürümleri için belirli bir yayım takvimi duyurmamış olsa da, bu modelin daha küçük geliştiriciler ve kendi verilerinin kullanımında daha fazla kontrol sahibi olmak isteyen şirketler tarafından kullanılmasını umut ediyor. Brockman, “Her zaman erişim engelini azaltmanın, inovasyonun artmasını sağladığına inanıyoruz” dedi. “İnsanlara tinkering yapma olanağı verirseniz, o zaman inanılmaz derecede sürpriz şeyler yapacaklardır.”
Sonuç
OpenAI’nin GPT-OSS modeli, açık modellerin getirdiği yenilikçi özelleştirme olanakları ve düşük maliyet avantajları sayesinde, teknoloji dünyasında önemli bir adım atmaktadır. Geliştiriciler, bu modelle birlikte daha fazla esneklik ve özelleştirme imkânına sahip olmanın yanı sıra, aynı zamanda değerlendirilebilir ve güvenli bir altyapı kullanarak projelerini şekillendirebileceklerdir. GPT-OSS’nin sunduğu avantajlar, yapay zeka alanında yeni ufuklar açacak ve daha fazla yeniliğin kapılarını aralayacaktır.


