Takvim uygulamaları üretkenlik için gereklidir ancak sürdürülebilir büyümeyi yalnızca temel kullanımdan ayıracak kadar ayrım yapmak zordur. Y Kombinatör destekli Süper güçlüToplantılarınız için kayıt botları gerektirmeyen, yapay zeka destekli bir not alma cihazı olan , bu barikatı aştı ve şimdi Vapiherkesin kolayca doğal ses veren, ses tabanlı, yapay zeka destekli bir asistan oluşturabilmesini sağlayan bir API sağlayıcısıdır.

Superpowered, 2020 yılında Jordan Dearsley ve Nikhil Gupta tarafından kuruldu. Ancak üzerinde üç yıl çalıştıktan sonra Dearsley, ekibin daha zorlu bir ürün üzerinde çalışmak istediğini söyledi. Şirket, Superpowered’ın kârlı olduğunu söylediği için ilk ürünü kapatmıyor; şu anda onu çalıştıracak birini getirme sürecinde. Y Combinator, haziran ayında ürünü haftada 10.000’den fazla kişinin kullandığını açıklamıştı ancak şirket herhangi bir güncel rakam sunmamıştı.

Resim Kredisi: Vapi

Bugüne kadar Superpowered/Vapi, aralarında Kleiner Perkins ve Abstract Ventures’ın da bulunduğu yatırımcılardan başlangıç ​​parası olarak 2,1 dolar topladı.

Vapi’ye dön

Şirket, geliştiricilerin yalnızca istemleri kullanarak bir bot oluşturmasına olanak tanıyan bir API olarak Vapi’yi sunuyor; daha sonra bunu bir telefon numarasının arkasına koyuyor. Ek olarak, geliştiricilerin botu web sitelerine ve mobil uygulamalara yerleştirebilmeleri için bir SDK entegrasyonu sunar.

Dearsley, TechCrunch’a e-posta yoluyla Vapi oluşturma fikrinin kişisel bir sorundan kaynaklandığını söyledi. San Fransisco’ya taşınmış ve farklı bir saat diliminde olan arkadaşlarını ve ailesini özlemeye başlamıştı. Düşüncelerini düzenlemek amacıyla diğer uçtaki bir telefon numarasına bağlı bir yapay zeka botu inşa ederek birisiyle konuştu.

“Beğendim ama ne kadar doğal olmadığı konusunda sürekli hayal kırıklığına uğradım. Bir insanla konuşmak gibi değildi. Ses kısık çıkıyordu, yanıt vermeden önce uzun gecikmeler oluyordu ve konuşurken sözümü kesiyordu.” dedi.

“Böylece üzerinde çalışmaya ve yürüyüşlerime onunla devam ettim. Sonunda bu konuşma problemine hayran kaldık. Bir şeyin insan olduğunu hissettirmek gerçekten zor. Sesli asistanlar Bugün hantal ve sıra tabanlı olduğundan, insan hissi veren bir şey inşa etmek istiyoruz.”

Teknik olarak Vapi, güçlü bir sesli konuşma platformu oluşturmak için şu anda bir dizi üçüncü taraf API’yi kullanıyor. Örneğin, telefon için Twilio, transkripsiyon için Deepgram, ses akışı için Daily, yanıtlar için OpenAI ve OynaHT metinden konuşmaya için.

2024 YC kış grubundaki bir girişim olan ScaleConvo, satış ekipleri ve mülk yönetimi şirketleri için konuşma botları başlatmak için halihazırda Vapi’yi kullanıyor. Ancak Vapi diğer müşterilerini açıklamadı. Şirket API’sini açıyor Vapi Telefon ve Vapi Web ürünleri bugün.

Vapi’nin Zorlukları

Multimodal konuşma girişimi Openstream.ai’nin eski Gartner analisti ve baş ürün sorumlusu Magnus Revan’a göre, girişimin karşılaştığı en büyük zorluklardan biri gecikmeyi azaltmak.

“OpenAI modellerinin yanıt vermesi 2 ila 10 saniye arası bir süreye ihtiyaç duyarken, telefonda altın standart, kullanıcının konuşmayı bitirmesi ile ‘bot’un konuşmaya başlaması arasında 700 ms’lik bir sürenin bulunmasıdır. Revan, yetenekli modellerle (LLaMA2 70B gibi yüksek parametre sayılı açık kaynaklı modeller) 1 saniyenin altındaki gecikme süresine ulaşmak gerçekten zor, dedi.

Şu anda Vapi’nin çeşitli faktörlere bağlı olarak 1,2-2 saniyelik bir gecikme süresi vardır. Dearsley, Vapi’nin kendi çalışması ve OpenAI’nin iyileştirmeleri sayesinde önümüzdeki ay gecikmeyi bir saniyenin altına indirmeyi bekliyor.

Vapi’deki melek yatırımcı Mohamed Musbah da girişimin çözümünün API’deki genel ilerlemelerle gelişeceğini söyledi.

“OpenAI ve diğerleri modellerini geliştirdikçe Vapi’nin platformu daha güçlü hale gelecek, daha iyi bilgi tabanları, kod yürütme yetenekleri ve daha geniş bağlam pencereleriyle donatılacak. Kullanıcıların sesli asistanlara olan talebi arttıkça Vapi’nin sesli iletişimdeki en büyük sürtünme alanlarını çözmeye odaklanması onun avantajı olacaktır” dedi.

Ancak bu, yükü Vapi’nin kendisinden ziyade diğer çözümlerin geliştirilmesine yüklüyor. Dearsley, büyük şirketlerin bu alana yönelmeye başlaması durumunda diğer API’lere güvenmenin Vapi’nin savunulabilirliğini azaltacağını söyledi. Ancak ekip, binlerce çağrıyı aynı anda yönetebilecek altyapıya sahip olma açısından bir avantaja sahip olduğunu söyledi. Dearsley, Vapi’nin halka yönelik web ve telefon API lansmanı ile ekibin aynı zamanda sesten sese çözümler için kendi modellerini oluşturmaya çalışacağını vurguladı.



genel-24