Sesli yapay zeka alanında müşteri destek ve hizmetleri, şu anda en popüler sektörlerden biri haline geldi. Ancak, insan sesi gibi duyulan ve hızlı bir yanıt veren bir ürün oluşturmanın bazı pazarlarda diğerlerinden çok daha zor olduğu ortaya çıktı; büyük oyuncuların çoğu, Afrika ve Orta Doğu’yı göz önünde bulundurarak inşa edilmemişti.
AethexAI, bu boşluğu doldurmak için geçen yıl kurulan bir girişim. 4DX Ventures tarafından yönetilen ve Enza Capital, Dorm Room Fund, Mojo Ventures ve Stanford GSB 26 Fund’ın katılımıyla 3 milyon dolar ön finansman topladı. Bireysel yatırımcılar arasında Stanford akademisyenleri, telekom yöneticileri ve Anthropic’ten yapay zeka araştırmacıları yer alıyor.
Mevcut orkestrasyon araçları olan Vapi ve LiveKit yerine, şirket yerel İngilizce, Fransızca ve Arapça lehçelerini ele almak için sıfırdan kendi küçük modelini ve orkestrasyon katmanını inşa etti. Bu karar, bölgedeki belirli operasyonel taleplerle yönlendirildi.
Şirket, teknolojisini denemeleri için işletmelere platformunu sunarken, geliştiricilerin modelleriyle denemeler yapabilmeleri için API’ler ve SDK’lar da sağlıyor.
Girişim, Mariama Diallo ve Ayooluwa Odemuyiwa tarafından kuruldu. CEO Diallo, Goldman Sachs’ta çalıştıktan sonra YC destekli ModelML’de ürün ve büyüme uzmanı olarak görev aldı. CTO Odemuyiwa ise Caltech’ten mezun olduktan sonra Meta’da çalıştı ve ardından Stanford İşletme Okulu’na kayıt oldu. İkili, gelişen pazarlar için bir şeyler inşa etmek istiyordu ve fırsatlar aramaya başladı.
Dünya genelinde işletmeler, operasyonlarının bazı bölümlerini otomatikleştirmek için yapay zeka araçlarını benimsemeye yarışıyor. Ancak bu her zaman başarılı olmuyor. Mısır’da bir çağrı merkezi, çağrıların önemli bir bölümünü otomatikleştirdi fakat kötü sonuçlar nedeniyle sistemi geri aldı. Afrika’daki birkaç destek merkezi, doğru maliyetle çağrıları otomatikleştirmek için mühendis bulmanın sürekli bir sorun olduğunu bildirdi.
Odemuyiwa, “Bu bölgelerde otomatik çağrılarda gördüğümüz gecikme ve titreme kabul edilemezdi. Eğer orkestratör olsaydık, yüksek gecikmeye sebep olacak büyük modeller kullanmak zorunda kalabilirdik. Bunun işe yaraması için, çok küçük modeller kullanmamız ve her adımda gecikmeyi azaltmamız gerektiğini fark ettik” dedi.
Yapay zeka laboratuvarları, son modellerini dağıtırken genellikle milyonlar harcayarak eğitir ve veri elde ederler. AethexAI bu iki sorun için çözüm buldu. En büyük modeller peşinde koşmak yerine, küçük modellerin yeterli olabileceğine karar verdi ve kendi Kora serisini geliştirdi. Bu seri, 300 milyon ile 1.7 milyar parametre arasında değişiyor. Bu, LLM’lerin boyutunun çok küçük bir kısmı ve tam olarak bu amaçla üretildi.
Bu modelleri eğitmek için, girişim bir çağrı merkezi ortağından anonimleştirilmiş kayıtlar kullandı. Ayrıca, Afrika genelinde daha fazla ses verisi toplamak için radyo istasyonlarına harici hard diskler gönderdi. Maliyetleri düşürmek için, veri etiketleme ve yerel isimleri telaffuz etmeleri için üniversite öğrencilerinden oluşan bir katkıda bulunan ağı oluşturdu. Sonuç olarak, girişim şimdi günde 17.000’den fazla çağrıya karşılık verdiğini belirtiyor.
Şirket, sesli yapay zekaya yeni adım atan müşterilere süreçte rehberlik ediyor; otomasyonu en iyi hangi kullanım durumlarıyla gerçekleştirebileceklerini belirlemelerine yardımcı olmak için yerinde demo ve atölye çalışmaları sunuyor.
Diallo, “Müşterilere her zaman şunu söylüyoruz: Şu anda herkes için her şey olamayız. Biz küçük bir şirketiz. Bir şirketle konuşmaya başladığımızda, onlardan bize en önemli olan bir kullanım durumunu seçmelerini istiyoruz” ifadelerini kullandı.
Şirket, her sektörde çalışmaya açık olmakla birlikte, şu anda kullanım durumlarının büyük bir kısmı borç tahsilatı, müşteri aktivasyonu veya KYC — Müşterinizi Tanıyın doğrulama gibi süreçlerle ilgili. Şirket, yerel pazarlara hizmet etmek için sözleşmeli mühendisler istihdam ediyor ve telekom sağlayıcılarıyla kanal ortaklıkları kurarak sesli yapay zeka çağrıları için telefon hizmeti sağlıyor. ‘Tak ve çalıştır’ çözümlerinin burada işe yaramayacağını vurguluyorlar.
4DX Ventures’ın ortak kurucu ve yönetici ortağı Walter Badoo, Afrika ve Orta Doğu pazarının, çoğu sesli yapay zeka firmasının hizmet vermek üzere tasarlandığı pazarlardan temelde farklı olduğunu savunuyor.
Badoo, “Afrika ve Orta Doğu’daki işletmeler, Batılı muadillerine kıyasla yaklaşık üç kat daha fazla çağrı hacmini işlemektedir, çünkü ses, müşteri etkileşimi için hâlâ baskın bir kanaldır” dedi. “Mevcut sistemler, yüksek kaliteli GPU altyapısı, standart İngilizce ve Avrupa konuşma ortamları ile ABD ve Avrupa’da yaygın olan işletme iş akışları için inşa edilmiştir. Bu durum, işletmelerin lehçeleri, anahtar değiştirmeleri ve günlük konuşma kalıplarını işleyebilen sistemlere ihtiyaç duyduğunda gerçek boşluklar yaratmaktadır.”
Başka bir deyişle, ElevenLabs, Deepgram, Sierra ve Cognigy gibi şirketler hızlı bir şekilde global olarak genişlerken, hizmet vermek üzere tasarlandıkları pazarlar ile girdikleri pazarlar her zaman aynı olamayabilir. AethexAI gibi girişimler, yerel lehçelere özel modeller, yerinde ortaklıklar ve bölgeye yönelik inşa edilmiş altyapıların gerçek bir pazar açılımı temsil ettiğine inanıyor.
Makale yardımıyla bağlantı üzerinden alışveriş yaptığınızda, küçük bir komisyon kazanabilmekteyiz. Bu, editoryal bağımsızlığımızı etkilemez.

