Silicon Valley, AI ajanlarını eğitmek için 'ortamlar'a büyük yatırım yapıyor. - Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film

Yenilikçi Yapay Zeka Ortamları: Pekiştirmeli Öğrenmenin Rolü

Son yıllarda Büyük Teknoloji CEO’ları, insanların görevlerini tamamlamak için bağımsız olarak yazılım uygulamalarını kullanabilen Yapay Zeka (YZ) ajanlarının vizyonunu savunuyor. Ancak, bugün piyasada bulunan kullanıcıya yönelik YZ ajanlarını test ettiğinizde, OpenAI’nin ChatGPT Ajanı veya Perplexity’nin Comet gibi, teknolojinin hala oldukça sınırlı olduğunu hızla fark edersiniz. Daha güçlü YZ ajanları oluşturmak, endüstrinin hala keşfettiği yeni teknikler gerektirebilir.

Contents

Yenilikçi Yapay Zeka Ortamları: Pekiştirmeli Öğrenmenin Rolü
RL Ortamı Nedir?
Sekreterya Alanındaki Yoğun Rekabet
Yeni Girişimler Ajan Nişlerini Hedefliyor
RL Ortamları Gerçekten Ölçeklenebilir Mi?

Bu tekniklerden biri, YZ ajanlarını çok adımlı görevlerde eğitmek için dikkatlice simüle edilmiş çalışma alanları oluşturmaktır. Bu pekiştirmeli öğrenme (RL) ortamları olarak adlandırılır. Geçmişte etiketli veri setlerinin yapay zekanın son dalgasını yönlendirdiği gibi, RL ortamları artık ajanların geliştirilmesinde kritik bir element haline gelmektedir.

RL Ortamı Nedir?

RL ortamları, temel olarak bir YZ ajanın gerçek bir yazılım uygulamasında gerçekleştireceği görevleri simüle eden eğitim alanlarıdır. Bir kurucu, RL ortamlarını oluşturmayı “çok sıkıcı bir video oyunu yaratmak” olarak tanımladı. Örneğin, bir ortam, bir Chrome tarayıcısını simüle edebilir ve bir YZ ajanına Amazon’dan bir çift çorap satın alma görevi verebilir. Ajana, başarılı olduğu durumda bir ödül sinyali gönderilir (bu örnekte, uygun bir çorap alması durumunda).

Bu görev basit görünse de, YZ ajanın birçok yerden takılma yaşaması mümkündür. Örneğin, web sayfasının açılır menülerine kaybolabilir veya fazladan çorap alabilir. Geliştiricilerin ajanın hangi yanlış yola sapacağını tam olarak tahmin edememesi nedeniyle, ortamın kendisinin beklenmedik davranışları yakalayacak kadar sağlam olması ve yine de faydalı geri bildirim sunabilmesi gerekir. Bu, ortamların oluşturulmasını statik bir veri kümesinden çok daha karmaşık hale getirir.

Bazı ortamlar, YZ ajanlarının araçlar kullanmasına, internete erişim sağlamasına veya çeşitli yazılım uygulamalarını kullanarak belirli görevleri tamamlamasına olanak tanırken, diğerleri, bir ajanın belirli görevleri öğrenmesine yardımcı olmaya yönelik daha dar bir hedefe sahiptir.

Sekreterya Alanındaki Yoğun Rekabet

AI veri etiketleme şirketleri; Scale AI, Surge ve Mercor gibi firmalar, RL ortamlarını geliştirmek amacıyla harekete geçiyor. Bu şirketler, birçok başlangıçtan daha fazla kaynak ve derin ilişkilere sahiptir. Surge CEO’su Edwin Chen, TechCrunch’a yaptığı açıklamada, AI laboratuvarlarında RL ortamlarına olan talebin “anlaşılır bir şekilde arttığını” belirtti.

Mercor ise, YZ ajansları ve RL ortamları için 10 milyar dolarlık bir değerlemeye sahip bir başlangıçtır. Şirket, yatırımcılara, sağlık, hukuk gibi alanlara yönelik RL ortamları inşa ettiğini duyuruyor.

Scale AI, veri etiketleme alanında öne çıkan bir şirketti, ancak son dönemde pazar payını kaybetti. Meta, Scale AI’ye 14 milyar dolar yatırım yaptıktan sonra CEO’sunu aldı, bu da şirketi zora soktu. Ancak Scale AI, yeni gelişmelere hızlıca uyum sağlama yeteneğini korumaktadır.

Yeni Girişimler Ajan Nişlerini Hedefliyor

Bazı yeni başlayanlar, başlangıçtan itibaren yalnızca RL ortamlarına odaklanma stratejisi benimsiyor. Bunlardan biri, “tüm işleri otomatikleştirme” cesur hedefini taşıyan Mechanize Work isimli yeni bir başlangıçtır. Kurucu Matthew Barnett, TechCrunch’a yaptığı açıklamada, şirketin YZ kodlama ajanları için RL ortamları oluşturma amacında olduğunu belirtiyor.

Prime Intellect ise, RL ortamlarını daha küçük geliştiricilere hitap eder hale getirmeye odaklanan bir diğer başlangıçtır. Geçen ay, Prime Intellect’in RL ortamları merkezi kuruldu. Bu merkez, açık kaynak geliştiricilere büyük YZ laboratuvarlarının sahip olduğu kaynaklara erişim sağlamayı hedefliyor.

RL Ortamları Gerçekten Ölçeklenebilir Mi?

RL ortamlarının ölçeklenebilirliği, daha önceki YZ eğitim yöntemleri gibi büyüyüp büyümeyeceği sorusu kafa karıştırıcı. Pekiştirmeli öğrenme, son bir yılda YZ’de önemli sıçramalara neden oldu, OpenAI’nin o1 ve Anthropic’in Claude Opus 4 gibi modeller bu alanda öncülük etti. Ancak, bu tekniklerin daha fazla gelişim sağlama potansiyeli belirsizliğini koruyor.

Bu aşamada, RL ortamları, YZ laboratuvarlarının YZ’ye yatırım yapma kararlarının bir parçası haline geldi ve daha fazla veri ile hesaplama kaynakları ekledikçe ilerlemeyi sağlayacağını düşünüyorlar. Ancak, hala birçok kişi bu alandaki rekabetin ve potansiyelin zorluklarının farkında.

Güncel Teknoloji Haberleri – 1

Silicon Valley, AI ajanlarını eğitmek için ‘ortamlar’a büyük yatırım yapıyor.

Yenilikçi Yapay Zeka Ortamları: Pekiştirmeli Öğrenmenin Rolü

RL Ortamı Nedir?

Sekreterya Alanındaki Yoğun Rekabet

Yeni Girişimler Ajan Nişlerini Hedefliyor

RL Ortamları Gerçekten Ölçeklenebilir Mi?

Sanal Medya

Son Eklenenler

United Airlines, ‘Trump Havalimanı’ Tartışmasına Nasıl Yanıt Verdi?

Yeni Kara Delik Teorisi: 50 Yıllık Problemi Çözüyor!

Andrey Santos Manchester United Şov Yaptı

Trump’dan Kanada’ya Tehditler

Eylem Sınıfları: O basit yapı, o dev hizmetin yerini alıyor.

Laravel Otomatik Yükleyici – Geliştirici Topluluğu

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer