Reuters’ın incelediği konuya yakın bir kaynak ve şirket içi belgelere göre, ChatGPT üreticisi OpenAI, “Strawberry” kod adlı bir projede yapay zeka modellerine yönelik yeni bir yaklaşım üzerinde çalışıyor.

Daha önce detayları açıklanmayan proje, Microsoft destekli girişimin sunduğu model türlerinin gelişmiş akıl yürütme yetenekleri sunabildiğini göstermek için yarıştığı bir dönemde ortaya çıktı.

Reuters’ın Mayıs ayında gördüğü son OpenAI dahili belgesinin bir kopyasına göre, OpenAI içindeki ekipler Strawberry üzerinde çalışıyor. Reuters, OpenAI’ın Strawberry’yi araştırma yapmak için nasıl kullanmayı planladığına dair bir planın ayrıntılarını veren belgenin kesin tarihini belirleyemedi. Kaynak, planı Reuters’a devam eden bir çalışma olarak tanımladı. Haber ajansı, Strawberry’nin kamuya açık hale gelmeye ne kadar yakın olduğunu belirleyemedi.

Strawberry’nin nasıl çalıştığı OpenAI içerisinde bile sıkı bir şekilde saklanan bir sırdır, dedi kaynak.

Belgede, şirketin yapay zekasının yalnızca sorulara yanıtlar üretmesini değil, aynı zamanda OpenAI’nin “derin araştırma” olarak adlandırdığı şeyi gerçekleştirmek için internette otonom ve güvenilir bir şekilde gezinebilecek kadar önceden planlama yapmasını sağlamayı amaçlayan Strawberry modellerini kullanan bir proje anlatılıyor.

Bir düzineden fazla yapay zeka araştırmacısıyla yapılan görüşmelere göre, bu, bugüne kadar yapay zeka modellerinin çözemediği bir şey.

Strawberry ve bu hikayede bildirilen detaylar sorulduğunda, bir OpenAI şirket sözcüsü bir açıklamada şunları söyledi: “AI modellerimizin dünyayı bizim gibi görmesini ve anlamasını istiyoruz. Yeni AI yeteneklerine yönelik sürekli araştırma, sektörde yaygın bir uygulamadır ve bu sistemlerin zamanla akıl yürütmede gelişeceğine dair ortak bir inanç vardır.”

Sözcü, Çilek ile ilgili sorulara doğrudan yanıt vermedi.

Reuters’ın geçen yıl bildirdiğine göre, daha önce Q* adıyla bilinen Çilek projesi şirket içinde bir atılım olarak görülüyordu.

İki kaynak, bu yılın başlarında OpenAI çalışanlarının kendilerine Q* demoları olarak adlandırdıklarını ve bunların günümüzde piyasada bulunan modellerin ulaşamayacağı zorlu bilim ve matematik sorularına cevap verebildiğini anlattı.

Bloomberg’e göre Salı günü, OpenAI dahili bir toplantıda, yeni insan benzeri muhakeme becerilerine sahip olduğunu iddia ettiği bir araştırma projesinin demosunu gösterdi. Bir OpenAI sözcüsü toplantıyı doğruladı ancak içerikle ilgili ayrıntıları vermeyi reddetti. Reuters, gösterilen projenin Strawberry olup olmadığını belirleyemedi.

OpenAI’nin konuya yakın bir kaynağı, bu yeniliğin yapay zeka modellerinin muhakeme yeteneklerini önemli ölçüde artıracağını umduğunu belirterek, Strawberry’nin çok büyük veri kümeleri üzerinde önceden eğitilmiş bir yapay zeka modelini işlemenin özel bir yolunu içerdiğini söyledi.

Reuters’ın görüştüğü araştırmacılar, yapay zekanın insan veya süper-insan seviyesinde zekaya ulaşmasında akıl yürütmenin kilit rol oynadığını söylüyor.

Büyük dil modelleri yoğun metinleri özetleyebilir ve zarif nesirleri herhangi bir insandan çok daha hızlı bir şekilde yazabilirken, teknoloji genellikle insanlara sezgisel görünen çözümlere sahip sağduyulu problemlerde, örneğin mantıksal yanılgıları tanıma ve üç taş oynamada yetersiz kalmaktadır. Model bu tür problemlerle karşılaştığında, genellikle sahte bilgi “halüsinasyonu” görür.

Reuters’ın görüştüğü yapay zeka araştırmacıları, genel olarak, yapay zeka bağlamında akıl yürütmenin, yapay zekanın önceden plan yapmasını, fiziksel dünyanın nasıl işlediğini yansıtmasını ve zorlu, çok adımlı problemleri güvenilir bir şekilde çözmesini sağlayan bir model oluşturmayı içerdiği konusunda hemfikir.

Yapay zeka modellerinde muhakemenin geliştirilmesi, modellerin büyük bilimsel keşifler yapmaktan yeni yazılım uygulamaları planlamaya ve oluşturmaya kadar her şeyi yapabilme yeteneğinin kilidini açmanın anahtarı olarak görülüyor.

OpenAI CEO’su Sam Altman, bu yılın başlarında yapay zeka alanında “ilerleme kaydedilecek en önemli alanların muhakeme yeteneği etrafında olacağını” söylemişti.

Google, Meta ve Microsoft gibi diğer şirketler de AI modellerinde muhakemeyi geliştirmek için farklı teknikler deniyorlar, AI araştırması yapan çoğu akademik laboratuvar da öyle. Ancak araştırmacılar, büyük dil modellerinin (LLM’ler) fikirleri ve uzun vadeli planlamayı tahmin yapma biçimlerine dahil edip edemedikleri konusunda farklı görüşlere sahipler. Örneğin, Meta’da çalışan modern AI’nın öncülerinden biri olan Yann LeCun, LLM’lerin insan benzeri muhakeme yeteneğine sahip olmadığını sık sık dile getirmiştir.

AI Zorlukları

Konuya yakın bir kaynak, Strawberry’nin OpenAI’nin bu zorlukların üstesinden gelme planının önemli bir bileşeni olduğunu söyledi. Reuters tarafından görülen belge, Strawberry’nin neyi mümkün kılmayı amaçladığını açıkladı, ancak nasılını açıklamadı.

Şirketin tekliflerini duyan dört kişiye göre, şirket son aylarda geliştiricilere ve diğer dış taraflara önemli ölçüde daha gelişmiş muhakeme yeteneklerine sahip bir teknolojiyi piyasaya sürmenin eşiğinde olduğunu özel olarak bildiriyor. Bu kişiler özel konular hakkında konuşma yetkisine sahip olmadıkları için kimliklerinin açıklanmasını istemediler.

Kaynaklardan birinin söylediğine göre Strawberry, OpenAI’nin üretken yapay zeka modellerinin “eğitim sonrası” olarak bilinen özel bir yolunu veya genelleştirilmiş veri yığınları üzerinde “eğitildikten” sonra temel modellerin performansını belirli şekillerde geliştirmek için uyarlanmasını içeriyor.

Bir modeli geliştirmenin eğitim sonrası aşaması, günümüzde hemen hemen tüm dil modellerinde kullanılan ve birçok çeşidi bulunan “ince ayar” gibi yöntemleri içerir; örneğin, insanların modele yanıtlarına göre geri bildirim vermesini ve ona iyi ve kötü yanıt örnekleri vermesini sağlamak gibi.

Konuyla ilgili bilgi sahibi kaynaklardan biri, Strawberry’nin 2022’de Stanford’da geliştirilen “Kendi Kendine Öğreten Akılcı” veya “STaR” adlı bir yönteme benzediğini söyledi. STaR, yapay zeka modellerinin kendi eğitim verilerini yinelemeli olarak oluşturarak kendilerini daha yüksek zeka seviyelerine “yükseltmelerini” sağlıyor ve teoride dil modellerinin insan seviyesindeki zekayı aşmasını sağlamak için kullanılabileceğini, yaratıcılarından biri olan Stanford profesörü Noah Goodman’ın Reuters’a söylediğine göre.

“Bence bu hem heyecan verici hem de korkutucu… eğer işler bu yönde devam ederse insanlar olarak düşünmemiz gereken bazı ciddi şeyler olacak,” dedi Goodman. Goodman, OpenAI ile bağlantılı değil ve Strawberry’yi de tanımıyor.

Belgede, OpenAI’nin Strawberry’nin hedeflediği yetenekler arasında uzun vadeli görevler (LHT) gerçekleştirmenin de yer aldığı belirtiliyor. İlk kaynak, bunun, önceden plan yapıp uzun bir zaman diliminde bir dizi eylemi gerçekleştirmeyi gerektiren karmaşık görevler olduğunu ifade ediyor.

Bunu yapmak için OpenAI, şirketin “derin araştırma” veri kümesi olarak adlandırdığı şey üzerinde modeller oluşturuyor, eğitiyor ve değerlendiriyor, OpenAI dahili belgelerine göre. Reuters, bu veri kümesinde ne olduğunu veya uzatılmış bir dönemin ne kadar uzun olacağını belirleyemedi.

Belgeye ve kaynaklardan birine göre, OpenAI modellerinin bu yetenekleri, bulgularına göre eylemlerde bulunabilen bir “CUA” veya bilgisayar kullanan bir aracı yardımıyla web’de otonom bir şekilde gezinerek araştırma yapmak için kullanmasını özellikle istiyor. OpenAI ayrıca yeteneklerini yazılım ve makine öğrenimi mühendislerinin işini yapma konusunda test etmeyi planlıyor.

© Thomson Reuters 2024



genel-8