Betaworks, AI trendini başka bir LLM ile değil, bunun yerine tanımlanması o kadar basit olmayan günlük görevleri otomatikleştiren bir dizi aracı tipi modelle benimsiyor. Yatırımcının en son “Kamp” kuluçka merkezi, günümüzün daha sıkıcı görevlerini üstleneceğini umdukları 9 yapay zeka aracı girişimini eğitti ve finanse etti.
Bu şirketlerin birçoğunun kullanım durumları umut verici görünüyor ancak yapay zeka, verdiği sözleri tutmakta zorluk yaşıyor. E-postalarınızı sizin için sıralaması için yeni ve parlak bir yapay zekaya güvenir miydiniz? Bir web sayfasından bilgi çıkarmaya ve yapılandırmaya ne dersiniz? Yapay zekanın çalışılan her yerde toplantı düzenlemesine aldırış eden var mı?
Bu hizmetlerde henüz oluşturulmamış bir güven unsuru var; çoğu teknolojide ortaya çıkan ve davranış şeklimizi değiştiren bir şey. MapQuest’ten yol tarifi istemek tuhaf geliyordu, ta ki öyle gelmeyene kadar – ve artık GPS navigasyonu günlük bir araç. Peki yapay zeka ajanları bu aşamada mı? Betaworks CEO’su ve kurucusu John Borthwick böyle düşünüyor. (Açıklama: Eski TechCrunch editörü ve Disrupt sunucusu Jordan Crook, firmada çalışmak üzere TC’den ayrıldı.)
TechCrunch’a “Düşünmek için çok zaman harcadığımız bir şeye giriş yapıyorsunuz” dedi. “Ajansal yapay zeka henüz başlangıç aşamasındayken ve temsilcilerin başarı oranları vb. konularda sorunlar mevcutken, Camp başladığından bu yana bile muazzam ilerlemeler görüyoruz.”
Teknoloji gelişmeye devam ederken Borthwick, bazı müşterilerin onu mevcut haliyle benimsemeye hazır olduğunu açıkladı.
“Tarihte, müşterilerin yüksek riskli görevlerde bile bir ürünün ‘yeterince iyi’ olup olmadığına inandığını gördük. Orijinal Bill.com, OCR ve e-posta kazımayla ilginç şeyler yapmasına rağmen her zaman doğru sonuca ulaşamadı ve kullanıcılar binlerce dolar değerindeki işlemlerde hâlâ ona güveniyorlardı çünkü berbat bir görevi daha az korkunç hale getiriyordu. Ve zamanla, iletişimselliği yüksek arayüz tasarımı sayesinde, bu müşterilerden gelen geri bildirim döngüleri daha iyi, daha güvenilir bir ürün yarattı” dedi.
“Şimdilik, Camp’teki ürünlerin ilk kullanıcılarının çoğu geliştiriciler, kurucular ve teknolojiyi erken benimseyenlerden oluşuyor ve bu grup, sonunda ana akıma sıçrayan bu ürünleri sabırla test etmeye ve geri bildirimde bulunmaya her zaman istekli oldu.”
Betaworks Camp, seçilen temadaki seçilen şirketlerin ürünleri, stratejileri ve bağlantıları konusunda uygulamalı yardım aldığı ve ardından 500 bin dolarlık bir çekle kapıdan kovulduğu üç aylık bir hızlandırıcıdır – Betaworks’ün kendisi, Mozilla Ventures, Differential’ın izniyle Ventures ve Stem AI. Ancak start-up’lar 7 Mayıs’taki demo gününde işlerini yürütmeden önce değil.
Ancak öncesinde kadroya göz attık. İşte bana en çok çarpan üç tanesi.
Twin, Rabbit’in birkaç aydır bahsettiğini duyduğumuz (ancak henüz piyasaya sürmediğimiz) bir “eylem modeli” kullanarak görevleri otomatikleştiriyor. Bir modeli, yazılım arayüzlerini temsil eden çok sayıda veri üzerinde eğiterek, ortak görevlerin nasıl tamamlanacağını, yani bir API’nin idare edebileceğinden daha karmaşık olan ancak bir başkasına devredilemeyecek kadar fazla olmayan şeyleri nasıl tamamlayacağını öğrenebilir (bu şirketler iddia ediyor). “akıllı stajyer.” Aslında bunları Ocak ayında yazdık.
Dolayısıyla, bir arka uç mühendisinin belirli bir görevi gerçekleştirmek için özel bir komut dosyası oluşturmasını sağlamak yerine, sıradan dilde gösterebilir veya tanımlayabilirsiniz. “Bugün aldığımız tüm özgeçmişleri Dropbox’ta bir klasöre koyun ve bunları başvuranın adıyla yeniden adlandırın, ardından bana Slack’teki paylaşım bağlantısını DM’den gönderin.” Ve bu iş akışında ince ayar yaptığınızda (“Hata, bu sefer uygulama tarihini dosya adlarına ekleyin”), sürecin yeni çalışma şekli olabilir. Zamanımızın %80’ini alan görevlerin %20’sini otomatikleştirmek şirketin hedefidir; asıl soru muhtemelen bunu uygun maliyetle yapıp yapamayacağıdır. (Twin, modellerinin ve eğitim süreçlerinin doğası hakkında ayrıntılı bilgi vermeyi reddetti.)
Skej iki (veya üç veya dört…) kişi için işe yarayan bir toplantı zamanı bulma gibi zaman zaman acı veren süreci iyileştirmeyi amaçlıyor. Botu bir e-postaya veya Slack dizisine cc’ye yerleştirirsiniz ve bu, herkesin uygunluk durumu ve tercihlerini uzlaştırma sürecini başlatır. Programlara erişimi varsa bunları kontrol edecektir; eğer biri perşembe günü öğleden sonrayı tercih edeceğini söylerse, bu da işe yarar; bazı kişilerin öncelikli olduğunu söyleyebilirsiniz; ve benzeri. Yetenekli bir yönetici asistanıyla çalışan herkes onların yeri doldurulamaz olduğunu bilir, ancak muhtemelen her EA, “Buna ne dersiniz?” türünden görevlere daha az zaman harcamayı tercih edecektir. HAYIR? Buna ne dersin?”
İnsan düşmanı biri olarak benim bu planlama sorunum yok, ancak diğerlerinin de yaşadığını takdir ediyorum ve aynı zamanda sonuçlara razı oldukları “ayarla ve unut” tipi bir çözümü tercih ederim. Ve bu, öncelikle formlardan ziyade doğal dili anlamakla görevlendirilen günümüzün yapay zeka ajanlarının yetenekleri dahilindedir.
Jsonify nispeten yapılandırılmamış bağlamlardan veri çıkarabilen web sitesi kazıyıcılarının bir evrimidir. Bu uzun zamandır yapılıyor ancak bilgiyi çıkaran motor hiç bu kadar akıllı olmamıştı. Büyük, düz bir belgeyse iyi çalışırlar; sitedeki sekmelerdeyse veya insanların tıklaması için tasarlanmış kötü kodlanmış bir görsel listedeyse başarısız olabilirler. Jsonify, basit tarayıcıların erişemeyeceği verileri daha iyi ayrıştırmak ve sıralamak için günümüzün görsel yapay zeka modellerinin gelişmiş anlayışından yararlanıyor.
Böylece, belirli bir bölgedeki Airbnb seçeneklerini arayabilir, ardından Jsonify’ın hepsini fiyat, havaalanına uzaklık, derecelendirme, gizli ücretler vb. sütunlarıyla yapılandırılmış bir listeye dökmesini sağlayabilirsiniz. Sonra aynı şeyi Vacasa’da da yapabilirsiniz. ve aynı verileri çıkartın – belki aynı yerler için (geçen gün bunu yaptım ve 150 dolar kadar tasarruf ettim, ancak keşke süreci otomatikleştirebilseydim). Veya profesyonel işler yapın.
Ancak yüksek lisans programlarının doğasında olan belirsizlik, onları bu iş için şüpheli bir araç haline getirmiyor mu? Kurucu Ananth Manivannan, “Oldukça sağlam bir korkuluk ve çapraz kontrol sistemi oluşturmayı başardık” dedi. “Çalışma zamanında sayfayı anlamak için bazı doğrulamalar sağlayan birkaç farklı model kullanıyoruz – ve kullandığımız LLM’ler kullanım durumumuza göre ince ayarlıdır, bu nedenle genellikle korkuluk katmanı olmadan bile oldukça güvenilirdirler. Kullanım senaryosuna bağlı olarak genellikle %95’in üzerinde ekstraksiyon doğruluğu görüyoruz..”
Bunlardan herhangi birinin muhtemelen herhangi bir ileri teknoloji işinde faydalı olduğunu görebiliyordum. Gruptaki diğerleri biraz daha teknik ve durumsaldır; işte geri kalan 6 tanesi:
- Çözümlenmiş AI – bulut iş akışlarının aracılı otomasyonu. Ismarlama entegrasyonlar yetişinceye kadar yararlı hissettiriyor.
- Sel – e-postanızı okuyan ve uygun yanıtları ve eylemleri hazırlarken önemli bilgileri bulan bir yapay zeka gelen kutusu yöneticisi.
- Genişletilebilir Yapay Zeka – Yapay zekanız geriliyor mu? Genişletilebilir’in dağıtımınız için doğru test ve günlük kaydı altyapısı olup olmadığını doktorunuza sorun.
- Rakip – çocukların kapsamlı etkileşime girebileceği ve oynayabileceği sanal bir karakter. Etik ve yasal olarak mayın tarlası gibi geliyor ama birinin oradan geçmesi gerekiyor.
- Yüksek Boyutlu Araştırma – alt oyun. Kullandıkça öde modeline sahip web tabanlı yapay zeka aracıları için bir çerçeve; böylece şirketinizin deney kraterleri açılırsa yalnızca birkaç kuruş borcunuz olur.
- Mbodi – eğitim verilerinin nispeten az olduğu bir alan olan robotik için üretken yapay zeka. Bunun Afrika kökenli bir kelime olduğunu sanıyordum ama sadece “somutlaştırmak”.
Yapay zeka aracılarının yakın gelecekte giderek otomatikleşen yazılım iş akışlarında bir rol oynayacağına pek şüphe yok, ancak bu rolün doğası ve kapsamı henüz yazılmamış. Açıkça görülüyor ki Betaworks, bazı ürünleri henüz kitlesel pazara sürülmeye hazır olmasa da kapıya erken adım atmayı hedefliyor.
Firmaların acentelik ürünlerini 7 Mayıs’ta görebileceksiniz.