Bir yıl öncesini, ChatGPT’yi bilmediğimiz geçen Kasım ayına kadar geçen süreyi, makine öğreniminin tamamen kredi onayları veya dolandırıcılığa karşı koruma gibi tek bir görevi çözecek modeller oluşturmakla ilgili olduğunu hatırlıyor musunuz? Bu yaklaşım, genelleştirilmiş Yüksek Lisans’ların yükselişiyle pencereden uçmuş gibi görünüyordu, ancak gerçek şu ki, genelleştirilmiş modeller her soruna pek uygun değil ve göreve dayalı modeller kuruluşta hala hayatta ve iyi durumda.

Bu göreve dayalı modeller, Yüksek Lisans’ların yükselişine kadar, kuruluştaki çoğu yapay zekanın temelini oluşturdu ve ortadan kaybolmayacaklar. Bu, Amazon CTO’su Werner Vogels’in bu haftaki açılış konuşmasında “eski moda güzel yapay zeka” olarak adlandırdığı şey ve ona göre, hâlâ birçok gerçek dünya sorununu çözen türden bir yapay zeka.

API’ler aracılığıyla çeşitli büyük dil modellerine bağlanmanın bir yolu olarak bu yılın başlarında tanıtılan ürün olan Amazon Bedrock’un genel müdürü Atul Deo, görev modellerinin öylece ortadan kaybolmayacağına da inanıyor. Bunun yerine cephanelikteki başka bir yapay zeka aracı haline geldiler.

“Geniş dil modellerinin ortaya çıkmasından önce çoğunlukla göreve özgü bir dünyadaydık. Deo, TechCrunch’a şöyle konuştu: “Ve buradaki fikir, belirli bir görev için sıfırdan bir model yetiştirmekti.” Görev modeli ile Yüksek Lisans arasındaki temel farkın, birinin belirli bir görev için eğitilmiş olması, diğerinin ise modelin sınırları dışındaki işleri halledebilmesi olduğunu söylüyor.

Yatırım şirketi Madrona’nın ortağı olan ve daha önce neredeyse on yılını AWS’de geçiren Jon Turow, sektörün büyük dil modellerinde akıl yürütme ve alan dışı sağlamlık gibi yeni ortaya çıkan yeteneklerden bahsettiğini söylüyor. “Bunlar, modelin başlangıçta ne yapması beklendiğinin dar bir tanımının ötesine geçebilmenizi sağlıyor” dedi. Ancak bu yeteneklerin ne kadar ileri gidebileceğinin hala tartışmaya açık olduğunu ekledi.

Deo gibi Turow da görev modellerinin aniden ortadan kaybolmayacağını söylüyor. “Göreve özgü modellerin hala bir rolü var çünkü daha küçük olabilirler, daha hızlı olabilirler, daha ucuz olabilirler ve hatta bazı durumlarda daha performanslı olabilirler çünkü belirli bir görev için tasarlandılar” dedi .

Ancak çok amaçlı bir modelin cazibesini göz ardı etmek zordur. Deo, “Bir şirkette toplu olarak baktığınızda, ayrı ayrı eğitilen yüzlerce makine öğrenimi modeli varken, bunun hiçbir anlamı yok” dedi. “Oysa daha yetenekli, geniş dilli bir modeli tercih ederseniz, yeniden kullanılabilirlik avantajından hemen yararlanırsınız ve aynı zamanda birçok farklı kullanım durumuyla başa çıkmak için tek bir model kullanmanıza olanak tanırsınız.”

Amazon için şirketin makine öğrenimi operasyon platformu SageMaker, Bedrock gibi geliştiriciler yerine veri bilimcilerini hedefleyen önemli bir ürün olmaya devam ediyor. Rapor ediyor onbinlerce müşteri milyonlarca model üretiyor. Bundan vazgeçmek çılgınlık olur ve açıkçası Yüksek Lisans’ın o anın tadı olması, daha önce gelen teknolojinin bir süre daha geçerliliğini korumayacağı anlamına gelmez.

Özellikle kurumsal yazılımlar bu şekilde çalışmaz. Hiç kimse önemli yatırımlarını, mevcut geniş dil modelleri kadar güçlü olsa bile yeni bir şey ortaya çıktı diye çöpe atmıyor. Amazon’un bu hafta, doğrudan büyük dil modellerini yönetmeyi amaçlayan SageMaker’a yönelik yükseltmeleri duyurduğunu belirtmekte fayda var.

Bu daha yetenekli büyük dil modellerinden önce, görev modeli gerçekten tek seçenekti ve şirketler, bu modellerin geliştirilmesine yardımcı olacak bir veri bilimci ekibi oluşturarak ona bu şekilde yaklaştılar. Araçların geliştiricilere yönelik olduğu büyük dil modelleri çağında veri bilimcinin rolü nedir? Turow, LLM’lere odaklanan şirketlerde bile hâlâ yapacak önemli bir işlerinin olduğunu düşünüyor.

“Veriler hakkında eleştirel düşünecekler ve bu aslında küçülen değil büyüyen bir rol” dedi. Turow, model ne olursa olsun, veri bilimcilerin insanların yapay zeka ile büyük şirketlerdeki veriler arasındaki ilişkiyi anlamalarına yardımcı olacağına inanıyor.

“Yapay zekanın neleri yapıp yapamayacağı, verilerin ne anlama gelip gelmediği konusunda her birimizin gerçekten eleştirel düşünmesi gerektiğini düşünüyorum” dedi. Ve bu, ister daha genelleştirilmiş bir geniş dil modeli, ister bir görev modeli oluşturuyor olun, bu doğrudur.

Bu nedenle bu iki yaklaşım bir süre daha aynı anda çalışmaya devam edecek çünkü bazen daha büyük olan daha iyidir, bazen de değildir.

TechCrunch'ta AWS re:Invent 2023 hakkında daha fazla bilgi edinin



genel-24