Rabbit r1, 2024’ün başlarında olmazsa olmaz bir cihazdı, ancak şirketin geniş kapsamlı vaatleri gerçekleşmeyince bu durum hızla değişti. CEO Jesse Lyu, “ilk günden itibaren beklentilerimizi çok yükseğe koyduk” diyor ancak önümüzdeki hafta cihazlara gelecek bir güncellemenin sonunda övülen Büyük Eylem Modeli’ni web’de serbest bırakacağını da söylüyor.

Şüpheciler bunu (haklı olarak) çok az, çok geç veya başka bir hedef değişimi olarak görebilirler; ancak Rabbit’in web ve mobil uygulamalar için platformdan bağımsız bir aracı inşa etme arzusu hala büyük ölçüde teorik olsa da temel bir değere sahiptir.

TechCrunch’a konuşan Lyu, son altı ayın gönderim, hata düzeltmeleri, yanıt sürelerinin iyileştirilmesi ve küçük özellikler eklenmesiyle dolu bir fırtına olduğunu söyledi. Ancak r1’e yapılan 16 kablosuz güncellemeye rağmen, temelde bir LLM ile etkileşime girmek veya Uber ve Spotify gibi yedi belirli hizmetten birine erişmekle sınırlı kalmaya devam ediyor.

“Bu, veri işçilerinden toplanan kayıtlar üzerinde eğitilen LAM’in ilk sürümüydü, ancak genel değil – yalnızca bu hizmetlere bağlanıyor,” dedi. LAM olarak adlandırdıkları şey olup olmadığı bu noktada oldukça akademik; model ne olursa olsun, Rabbit’in ilk çıkışında ayrıntılı olarak açıkladığı yetenekleri sağlamıyordu.

Resim Kredileri: Tavşan

Genel amaçlı web tabanlı bir ajan

Ancak Rabbit, Lyu’nun bana gösterdiği LAM’ın herhangi bir uygulamaya veya arayüze özgü olmayan ilk genel versiyonunu yayınlamaya hazır.

Bu sürüm, bir konsere bilet almak, bir web sitesine kaydolmak veya hatta çevrimiçi bir oyun oynamak gibi herhangi bir sıradan görevi yapmak için adımları akıl yürüten web tabanlı bir aracıdır. Lyu, “Amacımız çok açık: Eylül ayının sonunda, r1’iniz aniden çok daha fazla şey yapacak. Herhangi bir web sitesinde yapabileceğiniz her şeyi desteklemelidir,” dedi. (Şirket daha sonra güncelleme için 1 Ekim’de nihai bir tarih verdi.)

Bir görev verildiğinde, önce bu görevi adımlara böler, sonra ekranda gördüklerini analiz ederek bunları yürütmeye başlar: düğmeler, alanlar, resimler, konum veya görünümden bağımsız olarak. Sonra, web sitelerinin nasıl çalıştığına dair genel olarak öğrendiklerine dayanarak uygun öğeyle etkileşime girer.

(Uzaktan yöneten Lyu aracılığıyla) bir film festivali için yeni bir web sitesi kaydetmesini istedim. Birkaç saniyede bir eylem gerçekleştirerek Google’da alan adı kayıtlarını aradı, birini seçti (sanırım sponsorlu bir tane), alan adı kutusuna film festivali yazdı ve ortaya çıkan seçenekler listesinden 14 dolara “filmfestival2023.com”u seçti. Teknik olarak ona “2025 için” veya “korku festivali” veya benzeri bir kısıtlama koymamıştım.

Benzer şekilde, Lyu ondan bir r1 aramasını ve satın almasını istediğinde, hemen düzinelercesinin satışta olduğu eBay’e ulaştı. Belki bir kullanıcı için iyi bir sonuç ama basına sunum yapan şirketin kurucusu için değil! Gülüp geçti ve sadece resmi web sitesinden satın alınması gerektiğini ekleyerek tekrar aynı şeyi yaptı. Temsilci başardı.

Sonra, Dictionary.com’un günlük kelime oyununu oynattı. Biraz hızlı mühendislik gerektirdi (model, “son oyun”a basarak hızlıca bitirebildiği için bir çıkış yolu buldu) ama başardı.

Peki hangi tarayıcıyı kullanıyor? Buluttaki yeni, temiz bir tarayıcı, dedi Lyu, ancak Chrome uzantısı gibi yerel sürümler üzerinde çalışıyorlar, bu da mevcut oturumları kullanabileceğiniz ve hizmetlerinizde oturum açması gerekmeyeceği anlamına geliyor.

Bu amaçla, kullanıcılar anlaşılabilir bir şekilde (ve haklı olarak) herhangi bir şirkete kimlik bilgilerine tam erişim verme konusunda temkinli olduklarından, aracı bunlarla donatılmamıştır. Lyu, kimlik bilgilerinizle duvarla çevrili küçük bir dil modelinin gelecekte oturum açma işlemleri gerçekleştirmek için özel olarak çağrılabileceğini öne sürdü. Bunun nasıl çalışacağı açık bir soru gibi görünüyor ve bu, alanın yeniliği göz önüne alındığında bir şekilde beklenebilir.

Rabbit web sitesinden uygulamaların içindeki kullanıcı arayüzü analizine bir örnek.
Resim Kredileri: Tavşan

Hala öğreniyorum

Demo bana birkaç şey gösterdi. İlk olarak, şirkete ve geliştiricilerine bunun tamamen ayrıntılı bir aldatmaca olmadığına dair şüphe avantajı tanırsak (bazılarının inandığı gibi), çalışan, genel amaçlı bir web aracısı gibi görünüyor. Ve bu, kendi başına bir ilk olmasa da, tüketicilerin kolayca erişebileceği ilk şey olurdu.

“Dikey olarak Excel veya yasal belgeler için çalışan şirketler var, ancak bunun tüketiciler için ilk genel aracılardan biri olduğuna inanıyorum,” dedi Lyu. “Fikir, bir web sitesi aracılığıyla elde edilebilecek her şeyi söyleyebilmenizdir. Önce web siteleri için genel aracımız olacak, sonra uygulamalar için.”

İkincisi, hızlı mühendisliğin hala çok gerekli olduğunu gösterdi. Bir talebi nasıl ifade ettiğiniz, başarı ile başarısızlık arasındaki fark olabilir ve bu muhtemelen sıradan tüketicilerin hoş göreceği bir şey değildir.

Lyu, bunun hiçbir şekilde nihai olmayan bir “oyun alanı versiyonu” olduğunu ve tamamen işlevsel bir genel web aracısı olmasına rağmen birçok yönden geliştirilebileceğini söyledi. Örneğin, “model planlamayı yapacak kadar akıllı, ancak adımları atlayacak kadar akıllı değil.” dedi. Bir kullanıcının elektronik cihazlarını eBay’den satın almayı tercih etmediğini veya sponsorlu sonuçların duvarından kaçınmak için arama yaptıktan sonra aşağı kaydırması gerektiğini “öğrenemezdi”.

Kullanıcı verileri henüz modeli geliştirmek için toplanmayacak. Lyu bunu, bu tür bir sistem için temelde hiçbir değerlendirme yöntemi olmamasına bağladı, bu nedenle iyileştirmeler yapılıp yapılmadığını nicel olarak söylemek zor. Ancak bir “öğretme modu” da geliyor, böylece ona belirli bir görev türünün nasıl yapılacağını gösterebilirsiniz.

İlginçtir ki şirket ayrıca kelime işlemciler, müzik çalarlar ve tabii ki tarayıcılar gibi uygulamalarla etkileşime girebilen bir masaüstü aracısı üzerinde çalışıyor. Bu hala erken aşamalarda, ancak çalışıyor. “Bir hedef girmenize bile gerek yok, sadece bilgisayarı kullanmaya çalışıyor. Bir arayüz olduğu sürece onu kontrol edebilir.”

Üçüncüsü, hala bir “katil uygulama” yok veya en azından belirgin bir uygulama yok. Ajan etkileyici, ancak şahsen ben buna pek ihtiyaç duymazdım, ne yazık ki zaten günde sekiz saat bir tarayıcının önünde oturuyorum. Kesinlikle bazı harika uygulamalar var, ancak tarayıcı tabanlı bir otomatın faydasını, örneğin bir robot süpürgenin faydası kadar belirgin kılan hiçbir şey aklıma gelmedi.

Yine bir uygulama neden olmasın?

Tüm Rabbit iş modeline yönelik ortak itirazı dile getirdim, esasen “bu bir uygulama olabilir” şeklinde.

Lyu bu eleştiriyi birçok kez duymuştu ve cevabından emindi.

“Matematiği yaparsanız, mantıklı değil,” dedi. “Evet, teknik olarak başarılabilir, ancak Apple ve Google’ı ilk günden itibaren kızdıracaksınız. Bunun Siri veya Gemini’den daha iyi olmasına asla izin vermeyecekler. Tıpkı Apple zekasının Google işlerini daha iyi kontrol etmesinin veya tam tersinin mümkün olmaması gibi. Ve gelirin %30’unu alıyorlar! Başlangıçta sadece bir uygulama oluşturmuş olsaydık, asla bu ivmeyi elde edemezdik.”

Kullanılan tavşan r1. El modeli: The Washington Post’tan Chris Velazco.
Resim Kredileri: Devin Coldewey / TechCrunch

Rabbit’in yaptığı temel hamle, sizin gibi tüm diğer hizmetlerinize erişebilen ve bunları dışarıdan çalıştırabilen üçüncü taraf bir AI veya cihaz olabileceğidir. Lyu’nun dediği gibi, “Platformlar arası, genel bir aracı sistemi”. “Her kullanıcı arayüzünü kontrol edeceğiz ve web sitesi iyi bir başlangıç. Sonra Windows’a, MacOS’a, telefonlara geçeceğiz.”

Bu arada: “Gelecekte asla bir telefon üretmeyeceğimizi söylemedik.” Bu, daha küçük, daha basit bir cihaz hakkındaki orijinal tezlerine aykırı değil mi? Belki, belki de değil.

Bu arada, bu yılın başlarında verdikleri sözleri yerine getirmeye başlamak için çalışıyorlar. Yeni model, OTA güncellemesi yayınlandığında bu hafta içinde herhangi bir r1 sahibine sunulmalı. Nasıl başlatılacağına dair talimatlar da o zaman gelecek. Lyu, karakteristik küçümsemesiyle beklenti içindeki kullanıcıları uyardı.

“Beklentileri doğru ayarlıyoruz. Mükemmel değil,” dedi. “Bu, insan ırkının şu ana kadar elde ettiği en iyi şey.”



genel-24