Yapay zeka ajanlarının yapay zekadaki bir sonraki büyük şey olması gerekiyor, ancak ne olduklarına dair kesin bir tanım yok. Bu noktaya kadar insanlar bir yapay zeka ajanını tam olarak neyin oluşturduğu konusunda anlaşamıyorlar.
En basit haliyle, bir yapay zeka aracısı en iyi şekilde, bir insan müşteri hizmetleri temsilcisinin, İK personelinin veya BT yardım masası çalışanının geçmişte yapmış olabileceği bir dizi işi sizin için yapan yapay zeka destekli yazılım olarak tanımlanır. görev. Siz ondan bir şeyler yapmasını istersiniz ve o da bunları sizin için yapar; bazen birden fazla sistemi geçerek yalnızca soruları yanıtlamanın çok ötesine geçer. Örneğin Perplexity geçen ay insanların tatil alışverişi yapmalarına yardımcı olan bir yapay zeka aracısını piyasaya sürdü (ve tek ajan bu değil). Google geçen hafta uçuş ve otel bulmak, ev eşyaları alışverişi yapmak, yemek tarifleri bulmak ve diğer görevleri gerçekleştirmek için kullanılabilecek Project Mariner adlı ilk yapay zeka aracısını duyurdu.
Yeterince basit görünüyor, değil mi? Ancak netlik eksikliği nedeniyle karmaşıktır. Teknoloji devleri arasında bile bir fikir birliği yok. Google onları işe bağlı olarak göreve dayalı asistanlar olarak görüyor: geliştiriciler için kodlama yardımı; pazarlamacıların bir renk şeması oluşturmasına yardımcı olmak; Günlük verilerini sorgulayarak bir BT uzmanının bir sorunu takip etmesine yardımcı olmak.
Asana için bir temsilci, herhangi bir iyi iş arkadaşı gibi kendisine verilen görevleri yerine getiren fazladan bir çalışan gibi davranabilir. Salesforce eski CEO’su Bret Taylor ve Google veterineri Clay Bavor tarafından kurulan bir girişim olan Sierra, temsilcileri müşteri deneyimi araçları olarak görüyor ve insanların daha karmaşık sorun dizilerini çözmeye yardımcı olmak için geçmişin sohbet robotlarının çok ötesine geçen eylemler gerçekleştirmelerine yardımcı oluyor.
Bu tutarlı bir tanımın olmayışı, bu şeylerin tam olarak ne yapacakları konusunda kafa karışıklığına yer bırakmaktadır, ancak nasıl tanımlandıklarına bakılmaksızın, aracılar, görevlerin mümkün olduğunca az insan etkileşimi ile otomatik bir şekilde tamamlanmasına yardımcı olmak içindir.
Glasswing Ventures’ın kurucusu ve yönetici ortağı Rudina Seseri, henüz erken olduğunu ve bunun anlaşma eksikliğinin nedeni olabileceğini söylüyor. “’Yapay zeka ajanının’ ne olduğuna dair tek bir tanım yok. Ancak en yaygın görüş, bir aracının, çevresini algılamak, onun hakkında mantık yürütmek, kararlar almak ve belirli hedeflere otonom olarak ulaşmak için harekete geçmek üzere tasarlanmış akıllı bir yazılım sistemi olduğu yönündedir” dedi Seseri TechCrunch’a.
Bunu gerçekleştirmek için bir dizi yapay zeka teknolojisini kullandıklarını söylüyor. “Bu sistemler, dinamik alanlarda, otonom olarak veya diğer aracılar ve insan kullanıcılarla birlikte çalışmak için doğal dil işleme, makine öğrenimi ve bilgisayar görüşü gibi çeşitli AI/ML tekniklerini içeriyor.”
Box kurucu ortağı ve CEO’su Aaron Levie, zamanla yapay zeka daha yetenekli hale geldikçe, yapay zeka ajanlarının insanlar adına çok daha fazlasını yapabileceğini ve bu evrimi yönlendirecek dinamiklerin zaten devrede olduğunu söylüyor.
“Yapay zeka aracılarıyla, kendi kendini güçlendiren bir çarkın, Yapay Zeka Aracılarının yakın ve uzun vadede başarabileceklerini önemli ölçüde iyileştirmeye hizmet edecek birden fazla bileşeni var: GPU fiyatı/performansı, model verimliliği, model kalitesi ve zekası, yapay zeka çerçeveleri ve altyapı iyileştirmeleri,” diye yazdı Levie LinkedIn’de son zamanlarda.
Bu, kesin olmasa da tüm bu alanlarda büyümenin gerçekleşeceğini varsayan teknolojiye iyimser bir yaklaşım. MIT robot bilimi öncüsü Rodney Brooks, yakın tarihli bir TechCrunch röportajında yapay zekanın çoğu teknolojiden çok daha zorlu sorunlarla uğraşması gerektiğine ve Moore yasasına göre çiplerle aynı hızda büyümeyeceğine dikkat çekti.
“Bir insan, bir yapay zeka sisteminin bir görevi yerine getirdiğini gördüğünde, bunu hemen benzer şeylere genelliyor ve yapay zeka sisteminin yeterliliği hakkında bir tahminde bulunuyor; Sadece bununla ilgili performans değil, aynı zamanda bununla ilgili yeterlilik de önemli” dedi Brooks o röportaj sırasında. “Ve genellikle aşırı iyimserler ve bunun nedeni, bir kişinin bir görevdeki performansına ilişkin bir model kullanmalarıdır.”
Sorun, sistemlerin geçişinin zor olması ve bazı eski sistemlerin temel API erişimine sahip olmaması nedeniyle bu durumu karmaşık hale getiriyor. Levie’nin bahsettiği istikrarlı gelişmelere tanık olsak da, yazılımın birden fazla sisteme erişmesini ve yol boyunca karşılaşabileceği sorunları çözmesini sağlamak birçok kişinin düşündüğünden daha zorlayıcı olabilir.
Eğer durum buysa, herkes yapay zeka ajanlarının neler yapabileceğini abartıyor olabilir. HFS Araştırma’da araştırma lideri olan David Cushman, mevcut bot grubunu daha çok Asana’ya benzetiyor: Kullanıcı tanımlı bir tür stratejik hedefe ulaşmak için insanların belirli görevleri tamamlamasına yardımcı olan asistanlar. Buradaki zorluk, bir makinenin beklenmedik durumları gerçek anlamda otomatikleştirilmiş bir şekilde ele almasına yardımcı olmaktır ve açıkçası henüz buna yakın bir yerde değiliz.
“Bunun bir sonraki adım olduğunu düşünüyorum” dedi. “Yapay zekanın bağımsız ve etkili bir şekilde geniş ölçekte çalıştığı yer burası. İşte burası, insanların kuralları, korkulukları belirlediği ve insanı döngüden çıkarmak için birden fazla teknolojiyi uyguladığı yerdir; her şey insanı korumakla ilgiliyken içinde GenAI ile döngü” dedi. Yani buradaki anahtar, yapay zeka aracısının kontrolü ele almasına ve gerçek otomasyonu uygulamasına izin vermek olduğunu söyledi.
Madrona Ventures’ın ortaklarından Jon Turow, bunun, özellikle aracıları oluşturmak için tasarlanmış bir teknoloji yığını olan bir AI aracı altyapısının oluşturulmasını gerektireceğini söylüyor (onları nasıl tanımlarsanız tanımlayın). Yakın zamanda yayınlanan bir blog yazısında Turow AI ajanlarının özetlenen örnekleri şu anda vahşi doğada çalışıyorlar ve bugün nasıl inşa ediliyorlar.
Turow’a göre, yapay zeka ajanlarının giderek çoğalması – kendisi de tanımın hala anlaşılması zor olduğunu kabul ediyor – diğer teknolojiler gibi bir teknoloji yığını gerektiriyor. Yazısında “Bütün bunlar, sektörümüzün yapay zeka aracılarını ve onlara dayanan uygulamaları destekleyen altyapı oluşturmak için yapması gereken işler olduğu anlamına geliyor” diye yazdı.
“Zamanla, akıl yürütme yavaş yavaş gelişecek, sınır modelleri iş akışlarını daha fazla yönlendirmeye başlayacak ve geliştiriciler ürüne ve verilere, yani onları farklılaştıran şeylere odaklanmak isteyecek. Temel platformun ölçek, performans ve güvenilirlikle ‘sadece çalışmasını’ istiyorlar.”
Burada akılda tutulması gereken bir diğer şey, aracıların çalışmasını sağlamak için muhtemelen tek bir LLM yerine birden fazla modelin gerekli olacağıdır ve bu aracıları farklı görevlerin bir koleksiyonu olarak düşünürseniz bu mantıklı olur. “Şu anda herhangi bir büyük dil modelinin, en azından halka açık, yekpare büyük dil modelinin, aracı görevleri yerine getirebileceğini düşünmüyorum. Ajansal bir gelecek konusunda beni gerçekten heyecanlandıracak çok adımlı akıl yürütmeyi henüz yapabileceklerini düşünmüyorum. Yaklaştığımızı düşünüyorum ama henüz o noktada değil” dedi Macquarie US Equity Research ABD Yapay Zeka ve Yazılım Araştırması Başkanı Fred Havemeyer.
“En etkili aracıların, en etkili aracıya ve modele istek veya bilgi gönderen bir yönlendirme katmanına sahip birden fazla farklı modelden oluşan çoklu koleksiyonlar olacağını düşünüyorum. Ve bunun ilginç bir şey olacağını düşünüyorum [automated] süpervizör, bir tür rol devrediyor.
Nihayetinde Havemeyer için endüstri, bağımsız çalışan acentelerin bu hedefi doğrultusunda çalışıyor. “Acentelerin geleceği hakkında düşünürken, gerçekten özerk olan, soyut hedefler alabilen ve ardından aradaki tüm adımları tamamen bağımsız olarak düşünebilen acenteler görmek istiyorum ve görmeyi umuyorum” dedi. TechCrunch.
Ancak gerçek şu ki, bu ajanlar söz konusu olduğunda hâlâ bir geçiş dönemindeyiz ve Havemeyer’in tanımladığı bu son duruma ne zaman ulaşacağımızı bilmiyoruz. Şu ana kadar gördüklerimiz açıkça doğru yönde atılmış umut verici bir adım olsa da, yapay zeka ajanlarının bugün öngörüldüğü şekilde çalışabilmesi için hala bazı ilerlemelere ve atılımlara ihtiyacımız var. Ve henüz o noktaya gelmediğimizi anlamak önemlidir.
Bu hikaye ilk olarak 13 Temmuz 2024’te yayınlandı ve Perplexity ile Google’ın yeni temsilcilerini içerecek şekilde güncellendi.