Kyutai Labs Çarşamba günü gerçek zamanlı olarak sözlü olarak yanıt veren bir yapay zeka (AI) sohbet robotu olan Moshi AI’yı piyasaya sürdü. Fransız AI firması, Moshi’nin tüm ses dili modelinin şirket içinde geliştirildiğini duyurdu. Ayrıca duyguları ifade etmek ve çeşitli konuşma stilleriyle yanıt vermek için sesi modüle edebiliyor. AI modeline halk ücretsiz olarak erişebiliyor. Şu anda, AI modeli konuşmaları beş dakikayla sınırlıyor. İlginç bir şekilde, OpenAI de GPT-4o’nun piyasaya sürülmesiyle benzer konuşma özelliklerini duyurdu, ancak henüz piyasaya sürülmedi.
Moshi AI özellikleri
Şirket eyaletler AI modelinin sekiz kişilik bir ekiple altı ayda geliştirildiği. Kyutai Labs, Paris’teki bir etkinlikte AI modelini tanıtırken, Moshi’nin bir AI asistanı olmadığını, farklı kullanım durumları için araçlar geliştirmek için kullanılabilecek bir prototip olduğunu söyledi. Ayrıca sohbet robotunu herkese açık hale getirdi BuradaKullanıcılar e-posta adreslerini girerek sıraya girebiliyor, ancak Gadgets 360 personeli herhangi bir bekleme süresi olmadan platforma anında erişim sağlayabiliyor.
Dün, şimdiye kadar piyasaya sürülen en düşük gecikmeli konuşma AI’sı olan Moshi’yi tanıttık. Moshi, küçük sohbetler yapabilir, çeşitli kavramları açıklayabilir, birçok duygu ve konuşma stilinde rol yapabilir. Moshi ile burada konuşun https://t.co/a4EbAQiih7 ve aşağıdaki yöntem hakkında daha fazla bilgi edinin 🧵. resim.twitter.com/NkJRybTRLQ
— kyutai (@kyutai_labs) 4 Temmuz 2024
Platform arayüzü oldukça minimalisttir. Kullanıcıların konuştuklarında seslerinin yüksekliğini kontrol edebilecekleri basitleştirilmiş bir AI tasarımı vardır. Yalnızca AI’nın yanıtlarının göründüğü bir metin kutusu vardır. Üst tarafa yakın bir başka kutuda ses süresi, gecikme ve kaçırılan ses gibi teknik ayrıntılar görüntülenir.
En üstte, aramayı sonlandırmak için bir düğme var. Şu anda, maksimum arama süresi beş dakika olabilir. Açıklama sayfası, Moshi’nin konuşma akışını en üst düzeye çıkarmak için aynı anda düşünebildiğini, konuşabildiğini ve dinleyebildiğini vurgular.
Gadgets 360, gecikmenin son derece düşük olduğunu ve AI’nın sıklıkla anında yanıt verdiğini buldu. Ancak, yanıt süresindeki gecikmenin 10-15 saniyeyi aşabildiği birkaç durum var. Ancak bu, yoğun sunucu yükünden kaynaklanıyor olabilir. Ancak, bazen ses ölçerin dörtte üçü dolduktan sonra bile sözlü istemler hiç kaydedilmiyordu.
Gadgets 360 ayrıca AI modelinin duygusal bir sesle yanıt verebileceğini ve farklı stillerde ve çeşitli ses modülasyonları kullanarak konuşabileceğini buldu. AI modeli ayrıca İnternet’e bağlıdır ve web’de arama yapmayı gerektiren sorgulara yanıtlar getirebilir. Özellikle, chatbot metin istemlerine izin vermez ve onunla etkileşime girmek için tek ortam sestir.
Kyutai Labs, AI modelinin açık kaynaklı olacağını belirtti. Ancak AI firması henüz model ağırlıklarını ve kodunu bir portalda barındırmadı. Kullanılabilir olduğunda, kullanıcılar bunu yerel olarak indirip kurabilecek ve bağlantısız bir cihazda çalıştırılabilecek.
En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin X, Facebook, Naber, İş Parçacığı Ve Google HaberleriGadget’lar ve teknolojiyle ilgili en son videolar için abone olun Youtube kanalıEn iyi etkileyiciler hakkında her şeyi bilmek istiyorsanız, şirket içi takip edin KimBu360 Açık Instagram Ve Youtube.
Lava Blaze X 5G Fiyat Aralığı Hindistan Lansmanından Önce Sızdırıldı; MediaTek Dimensity 7050 SoC’ye Sahip Olması Bekleniyor