geçmişte altı ayda yapay zekada bazı inanılmaz gelişmelere tanık olduk. Stable Diffusion’ın piyasaya sürülmesi sanat dünyasını sonsuza dek değiştirdi ve ChatGPT-3 şarkı yazma, araştırma makalelerini taklit etme ve Google’da yaygın olarak sorulan sorulara kapsamlı ve görünüşte akıllı yanıtlar verme yeteneğiyle interneti salladı.

Üretken yapay zekadaki bu ilerlemeler, bir yapay zeka devriminin eşiğinde olduğumuza dair daha fazla kanıt sunuyor.

Bununla birlikte, bu üretken AI modellerinin çoğu temel modellerdir: çok büyük miktarda veri üzerinde eğitim yapan ve bunu yapmak için milyonlarca dolarlık işlem gücü gerektiren yüksek kapasiteli, denetimsiz öğrenme sistemleri. Şu anda, yalnızca büyük miktarda GPU gücüne erişimi olan iyi finanse edilmiş kurumlar bu modelleri oluşturabilmektedir.

Teknolojinin yaygın olarak benimsenmesini sağlayan uygulama katmanı yapay zekasını geliştiren şirketlerin çoğu, hâlâ büyük miktarda etiketli eğitim verisi kullanan denetimli öğrenmeye güveniyor. Temel modellerin etkileyici başarılarına rağmen, hala yapay zeka devriminin ilk günlerindeyiz ve çok sayıda darboğaz, uygulama katmanı yapay zekanın çoğalmasını engelliyor.

İyi bilinen veri etiketleme sorununun aşağısında, sonraki aşama yapay zekanın geliştirilmesini ve bunun üretim ortamlarına dağıtımını engelleyecek ek veri darboğazları mevcuttur.

Erken vaatlere ve yatırım seline rağmen sürücüsüz arabalar gibi teknolojilerin 2014’ten bu yana sadece bir yıl uzakta olmasının nedeni bu sorunlardır.

Bu heyecan verici kavram kanıtlama modelleri, araştırma ortamlarındaki karşılaştırmalı veri kümelerinde iyi performans gösterir, ancak gerçek dünyada piyasaya sürüldüklerinde doğru tahmin yapmakta zorlanırlar. Önemli bir sorun, teknolojinin yüksek riskli üretim ortamlarında gerekli olan daha yüksek performans eşiğini karşılamakta zorlanması ve sağlamlık, güvenilirlik ve sürdürülebilirlik için önemli kriterleri tutturamamasıdır.

Örneğin, bu modeller genellikle aykırı değerleri ve uç durumları kaldıramaz, bu nedenle kendi kendine giden arabalar, bisikletlerin yansımalarını bisikletlerin kendileri ile karıştırır. Güvenilir veya sağlam değiller, bu yüzden bir robot barista her beş seferden ikisinde mükemmel bir cappuccino yapıyor ama diğer üçünde bardağı döküyor.

Sonuç olarak, AI üretim açığı, yani “bu güzel” ile “bu yararlı” arasındaki boşluk, makine öğrenimi mühendislerinin ilk başta tahmin ettiğinden çok daha büyük ve zorlu olmuştur.

Sezginin aksine, en iyi sistemler aynı zamanda en fazla insan etkileşimine sahip sistemlerdir.

Neyse ki, giderek daha fazla makine öğrenimi mühendisi yapay zeka geliştirmeye yönelik veri merkezli bir yaklaşımı benimsedikçe, aktif öğrenme stratejilerinin uygulanması da artıyor. En gelişmiş şirketler, yapay zeka üretim açığını aşmak ve doğada daha hızlı çalışabilen modeller oluşturmak için bu teknolojiden yararlanacak.

Aktif öğrenme nedir?

Aktif öğrenme, denetimli bir model eğitimini yinelemeli bir süreç haline getirir. Model, büyük bir veri kümesinden etiketlenmiş verilerin ilk alt kümesi üzerinde eğitim alır. Ardından, öğrendiklerine dayanarak geri kalan etiketlenmemiş veriler üzerinde tahminler yapmaya çalışır. Makine öğrenimi mühendisleri, modelin tahminlerinde ne kadar kesin olduğunu ve çeşitli edinim fonksiyonlarıetiketlenmemiş örneklerden birine açıklama ekleyerek eklenen performans avantajını ölçebilir.

Model, tahminlerindeki belirsizliği ifade ederek, eğitimi için hangi ek verilerin en yararlı olacağına kendisi karar veriyor. Bunu yaparken, bir sonraki eğitim turunda bu alt küme üzerinde daha yoğun bir şekilde eğitim verebilmesi için, anlatıcılardan yalnızca bu belirli veri türüne ilişkin daha fazla örnek vermelerini ister. Bunu bir öğrenciye bilgi açığının nerede olduğunu bulmak için sınav yapmak gibi düşünün. Hangi sorunları kaçırdıklarını öğrendikten sonra, konunun belirli bir yönünü daha iyi anlamak için öğrenmelerini hedefleyebilmeleri için onlara ders kitapları, sunumlar ve diğer materyaller sağlayabilirsiniz.

Aktif öğrenme ile model eğitimi, doğrusal bir süreç olmaktan çıkıp güçlü bir geri bildirim döngüsüne sahip dairesel bir sürece geçer.

Sofistike şirketler neden aktif öğrenmeden yararlanmaya hazır olmalı?

Aktif öğrenme, prototip üretim açığını kapatmak ve model güvenilirliğini artırmak için esastır.

Yapay zeka sistemlerini statik bir yazılım parçası olarak düşünmek yaygın bir hatadır, ancak bu sistemler sürekli öğreniyor ve gelişiyor olmalıdır. Aksi takdirde aynı hataları tekrar tekrar yaparlar veya doğaya salındıklarında yeni senaryolarla karşılaşırlar, yeni hatalar yaparlar ve bunlardan ders alma şansları olmaz.



genel-24