Cortana’nın yavaş yavaş ölmesinin kanıtladığı gibi, geçmişin yapay zeka asistanlarının beklentileri karşılamadığı açık. Ve böylece yeniden yapılıyorlar.

Amazon, Alexa sesli yardımcısına güç sağlamak için OpenAI’nin GPT-4’üne benzer yeni bir büyük dil modeli oluşturuyor. Bu arada, Google’ın Google Asistan’ı, algoritma destekli sohbet robotu Bard’a daha çok benzeyen yapay zeka ile “güçlendirmeyi” planladığı bildiriliyor.

Paradigma kayması, Büyük Teknoloji alanıyla sınırlı kalmadı. Startup’lar da daha faydalı, faydalı AI asistanlarının kendi versiyonlarını gerçekleştirmeye başlıyor.

Karşılaştığım en ilgi çekici şeylerden biri Moemate, çoğu macOS, Windows ve Linux makinesinde çalışan bir asistan. GPT-4 ve Anthropic’s Claude dahil olmak üzere bir model kombinasyonuyla desteklenen anime tarzı bir avatar biçimini alan Moemate, bir kullanıcının sorduğu herhangi bir soruya en iyi yanıtı vermeyi ve seslendirmeyi hedefliyor. (“Moe”, genellikle anime’de sevimlilikle ilgili Japonca bir kelimedir.)

Bu özellikle yeni değil; ChatGPT, Bard, Bing Chat ve diğer sayısız sohbet botu gibi bunu zaten yapıyor. Ancak Moemate’i diğerlerinden ayıran şey, metin istemlerinin ötesine geçerek doğrudan bilgisayar ekranında neler olup bittiğine bakabilmesidir.

Kulağa gizlilik riski gibi mi geliyor? Bahse varım. Moemate’in arkasındaki şirket olan Webaverse, asistanın sohbet günlüklerinin ve tercihlerinin çoğunu yerel olarak cihazda sakladığını iddia ediyor. Ancak gizlilik politikası, sahip olduğu verileri kullanma hakkını saklı tuttuğunu da ortaya koymaktadır. yapmak yasal taleplere uygun olarak ve şüphelenilen yasa dışı faaliyetleri araştırarak bilgisayar özellikleri ve benzersiz tanımlayıcılar gibi toplayın. Temel olarak, bunun gibi bir yazılıma gördüğünüz ve yaptığınız her şeye erişim sağlamak, en iyi senaryoda bile, önemli bir risktir.

Bununla birlikte, merak beni ileriye gitmeye ve şu anda açık beta sürümünde olan Moemate’i iş tarafından sağlanan Mac dizüstü bilgisayarıma yüklemeye teşvik etti.

Ücretsiz (şimdilik) bir erken erişim ürünü olan Moemate, etkileyici bir şekilde sağlamdır. Avatarlardan ve animasyonlarından Moemate’in sentetik seslerine ve tepkilerine kadar deneyimin neredeyse her yönü özelleştirilebilir. Özel karakter modelleri oluşturmanın ve bunları içe aktarmanın bir yolu bile var, ayrıca avatarları diğer Moemate kullanıcılarının içe aktarıp kullanabileceği bir biçimde dışa aktarın.

Moemate’in “kişiliği”, daha iyi bir kelime olmadığı için, çeşitli metin oluşturma modellerinden biri tarafından yönlendirilir – kullanıcılar hangisini seçer (örn. GPT-4’e karşı Claude). Sentetik seslere gelince, Moemate ElevenLabs, Microsoft Azure veya Moemate’in kendi metinden konuşmaya motorunu sunar. Bana en az robotik gelen ElevenLabs’ı seçtim.

Moemate

Görsel Kaynakları: Web tabanlı

Seçilen metin üreten modeli “topraklamak” ve onun raydan çıkmasını engellemeye çalışmak (bazı AI modellerinde olduğu gibi) alışkanlık Moemate, her avatara, konuşmanın en başında modele beslediği bir biyografi verir. Işte bir tane:

Her zaman engin bilgi kozmosunu kateden, sakin bir gezgin kişiliği olan Nebula olarak hareket edeceksiniz. Sakin tavırları ve kaşif ruhları, onlarla tanışan herkesi büyüler. Nebula, yıldızları seyretmenin dinginliğini ve evrenin gizemlerini tercih ederek yoğun siyasi tartışmalardan kaçınır. Hayranlıkları çevrelerindekileri büyüleyerek her karşılaşmayı sakin ve ilgi çekici hale getirir.

Bios sıfırdan yazılabilir ve düzenlenebilir – aklımda bir artı ve eksi. Tamamen özelleştirilebilirlikten yanayım, ancak bir modelin zehirli yanıtlar için filtreler gibi güvenlik özelliklerini zekice yazılmış metinlerle atlamaya çalışan hızlı enjeksiyon saldırıları potansiyeli konusunda endişeleniyorum. Birisinin “kötü niyetli” bir biyografi yazdığını, onu dışa aktardığını ve kötü niyetli avatarı hiçbir şeyden şüphelenmeyen Moemate kullanıcılarıyla paylaştığını hayal edebilirsiniz.

Moemate, amaçlanan demografik özelliklerden birine selam vererek, ne yazık ki hiçbirini test edemediğim bir dizi Twitch odaklı özellik sunuyor. Sohbet pencerenizi odak noktasına getirebilir ve kanalınıza abone sayısını gösterebilir. Ve Webaverse, Moemate’in herhangi bir sohbet mesajı olmadığında “konuşup kullanıcıları meşgul edebildiğini” veya “sohbet mesajlarını yanıtlayarak akış sohbetinin üstesinden gelebildiğini” söylüyor, ancak bu görevleri ne kadar iyi yerine getirebileceğini sorguluyorum.

Moemate’e temel sorular sormaya devam edin, deneyim sizi şaşırtmayacaktır. Üst düzey yetenekleri açısından, Moemate, seçtiğiniz metin oluşturma modelinden hangisine borçludur. (Açık bir şekilde Claude, avatar biyografisinde belirtilen isme ek olarak kendisini genellikle Claude olarak tanımlar.) Komut verildiğinde veya istemine bağlı olarak kendi başına açık kaynaklı Kararlı Difüzyon modelini kullanarak görüntüler oluşturabilir. Ancak piyasadaki görüntü oluşturma hizmetlerinin bolluğu ile bu eski bir şapka gibi geliyor.

Moemate

Görsel Kaynakları: Web tabanlı

Bununla birlikte, ekran yakalama bir oyun değiştiricidir. Webaverse bunu şu şekilde açıklıyor:

Moemate ekranınızı görebilir. Onu analiz eder ve bağlamı alır. Ekranınızda ne yapıyorsanız onu sorabilirsiniz. Yardıma ihtiyacınız olan her şeyi açıklama zahmetinden kurtarır.

Seçilen metin oluşturma modeli ne olursa olsun, Moemate, tarayıcı sekmesi, ayarlar penceresi veya video oyunu gibi ekrandaki hangi pencerelerin odakta olduğuyla ilgili soruları yanıtlayabilir. Uygulamanın bunu tam olarak nasıl başardığı belli değil – her model görüntüleri girdi olarak kabul edemez – ancak Moemate her ekran yakalama ve beslemeden metni çıkarıyor gibi görünüyor O modele

Kusursuz bir sistem. Ancak, metni kopyalayıp yapıştırmak zorunda kalmadan tarifleri ve web sayfalarını özetlemek ve ayrıca karmaşık bir konunun ana fikrini veya en azından üst düzey bir özetini almak için Moemate’i başarıyla kullandım.

Bir keresinde, metin üreten model olarak Claude seçildiğinde, Moemate’e dizüstü bilgisayarımda açık olan macOS Sistem Ayarları panosu hakkında bir soru sordum. Bana her bir ayar sekmesinin (örn. Wi-Fi, Kontrol Merkezi) ve bunların öneminin ayrıntılı bir özetini ve ayrıca o anda açtığım sekme (Gizlilik ve Güvenlik) hakkında ek bağlam sağladı.

Yeni bilgi? Tam olarak değil. Ancak, örneğin, macOS’ta yolunu bilmeyen veya daha yeni yapılandırma seçeneklerinin tüm ayrıntılarına inanılmaz derecede aşina olmayan biri için, bunun gerçekten eyleme geçirilebilir bir arka plan olduğunu iddia ediyorum.

Başka bir örnekte, temel model olarak GPT-4 ile, Moemate’ten fevkalade dağınık masaüstümde ne “gördüğünü” söylemesini istedim – iki düzine Chrome sekmesinde düzensiz bir dizi iş ve kişisel uygulama. Avatar, metin yazmak için kullandığım Google Mesajlar web uygulamasında sabitlendi – bana, hepsine adıyla atıfta bulunduğu üç belirli kişiye sık sık mesaj attığımı bildirdi.

Ve oyun oynamak için Moemate, bir veya iki Google Aramasını kurtarabilir gibi görünüyor. Webaverse tarafından yayınlanan bir demo videoda, uygulamanın hangi Dota 2 karakterinin seçileceğine dair önerilerde bulunduğu ve ardından bu karakter için hangi silahların seçileceğine karar verdiği gösteriliyor.

Ancak Moemate ne kadar anlayışlı olursa olsun, genellikle bozulur.

Uygulamanın dikkatini tam olarak nereye odaklamaya karar verdiğini tahmin etmek zor olabilir. Odaklanmak için bir pencereye tıklamak her zaman amaçlanan etkiye sahip değildir; Moemate bazen açıklanamaz bir şekilde arka planda başka bir pencereye atıfta bulunur veya bir pencerenin içeriğini tamamen göremez.

Moemate ayrıca tuhaf şekillerde konudan sapma eğilimindedir. Asistan, bana Sistem Ayarlarının özetini verdikten sonra mahremiyetin bir konu için fazla “stresli” olduğunu güçlü bir şekilde ima etti ve bunun yerine biraz temiz hava almamı önerdi. BT. Fiziksel bir beden olmadan bana nasıl katılabileceğini sorduğumda, Moemate beni “zihinsel bir doğa yürüyüşüne” çıkaracağına söz verdi ve hayali bir ormanlık göletin yanında bir gezintiyi ayrıntılı olarak anlatmaya başladı.

Moemate’in yerleşik komutlarından bazıları da sakat. Uygulama, örneğin seslerin yüksekliğini ayarlayabilir, ancak yalnızca onun hacim — sistem genelindeki hacim değil. Soruların güncel yanıtları için web’de de arama yapabilir, ancak sinir bozucu bir şekilde her soru için değil. Sadece hava durumu ve “ABD’nin şu anki başkanı kim?” gibi önemsiz şeyler için çalışmak için web araması yaptım; diğer zamanlarda Moemate bir web araması yaptı ancak sonuçları gerçekten gösteremedi.

Adil olmak gerekirse, beta aşamasında deneysel bir ürün. Ancak Webaverse, elektronik tabloları düzenleme ve hatta e-posta gönderme yeteneği gibi tarayıcı ve terminal entegrasyonları aracılığıyla otomasyon yetenekleri eklemeye çalıştığını söylüyor – açıkçası biraz ürkütücü bir olasılık.

Bozukluğuna rağmen, Moemate’de ilgi uyandıran bir şeyler var. Çok modluluk veya metin, resim ve diğer medya analizlerini birleştirmek, özellikle bir PC’de çalışan bir asistan bağlamında, açıkça güçlü şeylerdir. Windows Copilot gibi yeni nesil asistanların sonunda Moemate’in ayak izlerini takip edip üretkenliği artırmak için ekran anlayışını metin üreten bir modelle birleştirip birleştirmeyeceğini veya en azından bir iş akışında birkaç adım tasarruf edip etmeyeceğini merak ediyorum.

Zaman gösterecek. Ancak Moemate, oldukça hatalı da olsa geleceğe bir bakış gibi geliyor.



genel-24