Yapay zeka ajanlarının yapay zekadaki bir sonraki büyük şey olması bekleniyor, ancak bunların ne olduğuna dair kesin bir tanım yok. Bu noktada, insanlar bir yapay zeka ajanının tam olarak neyi oluşturduğu konusunda anlaşamıyor.
En basit haliyle, bir AI aracısı, geçmişte bir insan müşteri hizmetleri aracısının, İK personelinin veya BT yardım masası çalışanının yapmış olabileceği bir dizi işi sizin için yapan AI destekli bir yazılım olarak tanımlanabilir, ancak bu nihayetinde herhangi bir görevi içerebilir. Siz ondan bir şeyler yapmasını istersiniz ve o bunları sizin için yapar, bazen birden fazla sistemi geçer ve sadece soruları yanıtlamanın çok ötesine geçer.
Yeterince basit görünüyor, değil mi? Ancak netlik eksikliği nedeniyle karmaşıktır. Teknoloji devleri arasında bile bir fikir birliği yoktur. Google bunları işe bağlı olarak görev tabanlı asistanlar olarak görür: geliştiriciler için kodlama yardımı; pazarlamacıların bir renk şeması oluşturmasına yardımcı olma; bir BT uzmanının günlük verilerini sorgulayarak bir sorunu izlemesine yardımcı olma.
Asana için bir temsilci, herhangi bir iyi iş arkadaşı gibi atanan görevlerle ilgilenen fazladan bir çalışan gibi davranabilir. Eski Salesforce eş CEO’su Bret Taylor ve Google emektarı Clay Bavor tarafından kurulan bir girişim olan Sierra, temsilcileri müşteri deneyimi araçları olarak görüyor ve insanların geçmişteki sohbet robotlarının çok ötesine geçen eylemler gerçekleştirmelerine ve daha karmaşık sorun kümelerini çözmelerine yardımcı oluyor.
Tutarlı bir tanımın olmaması, bu şeylerin tam olarak ne yapacağı konusunda kafa karışıklığına yol açıyor; ancak nasıl tanımlandıkları önemli değil, bu aracılar mümkün olduğunca az insan etkileşimiyle görevlerin otomatik bir şekilde tamamlanmasına yardımcı olmak için varlar.
Glasswing Ventures’ın kurucusu ve yönetici ortağı Rudina Seseri, bunun erken günler olduğunu ve bu durumun fikir birliğinin eksikliğini açıklayabileceğini söylüyor. “Bir ‘AI aracısı’nın ne olduğuna dair tek bir tanım yok. Ancak en sık görülen görüş, bir aracının çevresini algılamak, bunun hakkında akıl yürütmek, kararlar almak ve belirli hedeflere otonom olarak ulaşmak için eylemlerde bulunmak üzere tasarlanmış akıllı bir yazılım sistemi olduğudur,” dedi Seseri TechCrunch’a.
Bunu gerçekleştirmek için bir dizi AI teknolojisi kullandıklarını söylüyor. “Bu sistemler, dinamik alanlarda, otonom olarak veya diğer aracılar ve insan kullanıcılarla birlikte çalışmak için doğal dil işleme, makine öğrenimi ve bilgisayar görüşü gibi çeşitli AI/ML tekniklerini bir araya getiriyor.”
Box’ın kurucu ortağı ve CEO’su Aaron Levie, zamanla yapay zeka daha yetenekli hale geldikçe yapay zeka ajanlarının insanlar adına çok daha fazlasını yapabileceklerini ve bu evrimi yönlendirecek dinamiklerin halihazırda mevcut olduğunu söylüyor.
Levie, “Yapay zeka ajanlarıyla, yapay zeka ajanlarının yakın ve uzun vadede başarabileceklerini önemli ölçüde iyileştirmeye hizmet edecek, kendi kendini güçlendiren bir çarkın birden fazla bileşeni vardır: GPU fiyat/performans, model verimliliği, model kalitesi ve zekası, yapay zeka çerçeveleri ve altyapı iyileştirmeleri” diye yazdı. Linkedin üzerinde son zamanlarda.
Bu, tüm bu alanlarda büyüme olacağını varsayan teknolojiye dair iyimser bir bakış açısıdır; ancak bu kesin değildir. MIT robotik öncüsü Rodney Brooks, yakın zamanda TechCrunch’ta yaptığı bir röportajda, yapay zekanın çoğu teknolojiden çok daha zor sorunlarla uğraşmak zorunda olduğunu ve Moore Yasası uyarınca çiplerin olduğu kadar hızlı büyümeyeceğini belirtti.
Brooks, röportaj sırasında “Bir insan bir AI sisteminin bir görevi yerine getirdiğini gördüğünde, bunu hemen benzer şeylere genelleştirir ve AI sisteminin yeterliliği hakkında bir tahminde bulunur; sadece o konudaki performansı değil, etrafındaki yeterliliği de” dedi. “Ve genellikle aşırı iyimserdirler ve bunun nedeni, bir kişinin bir görevdeki performansının bir modelini kullanmalarıdır.”
Sorun, sistemleri geçmenin zor olması ve bunun bazı eski sistemlerin temel API erişiminden yoksun olması gerçeğiyle karmaşıklaşmasıdır. Levie’nin değindiği istikrarlı iyileştirmeleri görsek de, yazılımın yol boyunca karşılaşabileceği sorunları çözerken birden fazla sisteme erişmesini sağlamak, birçok kişinin düşündüğünden daha zorlayıcı olabilir.
Eğer durum buysa, herkes AI ajanlarının neler yapabilmesi gerektiğini abartıyor olabilir. HFS Research’te araştırma lideri olan David Cushman, mevcut bot grubunu daha çok Asana’ya benzetiyor: Kullanıcı tarafından tanımlanan bir tür stratejik hedefe ulaşmak amacıyla insanların belirli görevleri tamamlamasına yardımcı olan asistanlar. Zorluk, bir makinenin olasılıkları gerçekten otomatik bir şekilde ele almasına yardımcı olmaktır ve henüz buna yakın bile değiliz.
“Bence bu bir sonraki adım,” dedi. “Bu, yapay zekanın bağımsız ve etkili bir şekilde ölçeklendiği yer. Yani burası, insanların kuralları, korumaları belirlediği ve insanı devreden çıkarmak için birden fazla teknolojiyi uyguladığı yer – her şey insanı korumakla ilgiliyken içinde “GenAI ile döngüyü” dedi. Bu yüzden buradaki anahtar nokta, dedi, AI aracısının devralmasına ve gerçek otomasyonu uygulamasına izin vermek.
Madrona Ventures’ta ortak olan Jon Turow, bunun bir AI aracı altyapısının, yani aracıları (nasıl tanımlarsanız tanımlayın) oluşturmak için özel olarak tasarlanmış bir teknoloji yığınının oluşturulmasını gerektireceğini söylüyor. Turow, yakın zamanda yayınladığı bir blog yazısında AI ajanlarının ana hatlarıyla belirtilen örnekleri şu anda vahşi doğada nasıl çalıştıklarını ve bugün nasıl inşa edildiklerini anlatıyorlar.
Turow’un görüşüne göre, AI ajanlarının artan yaygınlığı – ve tanımın hala biraz belirsiz olduğunu da kabul ediyor – diğer teknolojiler gibi bir teknoloji yığını gerektiriyor. “Tüm bunlar, sektörümüzün AI ajanlarını ve onlara dayanan uygulamaları destekleyen bir altyapı inşa etmek için yapması gereken işler olduğu anlamına geliyor,” diye yazdı yazısında.
“Zamanla, akıl yürütme giderek gelişecek, sınır modelleri iş akışlarının daha fazlasını yönlendirecek ve geliştiriciler ürün ve verilere odaklanmak isteyecekler; onları farklılaştıran şeylere. Altta yatan platformun ölçek, performans ve güvenilirlikle ‘sadece çalışmasını’ istiyorlar.”
Burada akılda tutulması gereken bir diğer şey, ajanların çalışması için muhtemelen tek bir LLM yerine birden fazla modele ihtiyaç duyulacağıdır ve bu ajanları farklı görevlerin bir koleksiyonu olarak düşünürseniz bu mantıklıdır. Macquarie US Equity Research’te ABD Yapay Zeka ve Yazılım Araştırmaları başkanı Fred Havemeyer, “Şu anda herhangi bir tek büyük dil modelinin, en azından kamuya açık, monolitik büyük dil modelinin, ajan görevlerini idare edebileceğini düşünmüyorum. Beni ajan geleceği konusunda gerçekten heyecanlandıracak çok adımlı akıl yürütmeyi henüz yapabileceklerini sanmıyorum. Sanırım yaklaşıyoruz, ancak henüz orada değiliz,” dedi.
“En etkili ajanların muhtemelen en etkili ajana ve modele istek veya istem gönderen bir yönlendirme katmanına sahip birden fazla farklı modelin birden fazla koleksiyonu olacağını düşünüyorum. Ve bunun ilginç bir şey olacağını düşünüyorum [automated] “Denetleyici, devreden türden bir rol.”
Havemeyer için sektör, nihayetinde acentelerin bağımsız olarak faaliyet göstermesi hedefine doğru çalışıyor. TechCrunch’a verdiği demeçte, “Acentelerin geleceğini düşündüğümde, gerçekten özerk olan ve soyut hedefler belirleyip ardından aralarındaki tüm bireysel adımları tamamen bağımsız bir şekilde çıkarabilen acenteler görmek istiyorum ve görmeyi umuyorum.” dedi.
Ancak gerçek şu ki, bu ajanlar söz konusu olduğunda hala bir geçiş dönemindeyiz ve Havemeyer’in tanımladığı bu son duruma ne zaman ulaşacağımızı bilmiyoruz. Şimdiye kadar gördüğümüz şey açıkça doğru yönde atılmış umut verici bir adım olsa da, AI ajanlarının bugün öngörüldüğü gibi çalışması için hala bazı ilerlemelere ve atılımlara ihtiyacımız var. Ve henüz orada olmadığımızı anlamak önemlidir.