Fransız yapay zeka şirketi Mistral, sesli asistanlar ve müşteri destek hizmetleri gibi kurumsal kullanım alanları için yeni bir açık kaynak metinden konuşmaya dönüştürme modeli olan Voxtral TTS’yi tanıttı. Bu kapsamlı model, Mistral’ı ElevenLabs, Deepgram ve OpenAI gibi sektördeki devlerle doğrudan rekabete sokuyor.
Voxtral TTS: Çok Dilli ve Yenilikçi
Voxtral TTS, İngilizce, Fransızca, Almanca, İspanyolca, Hollandaca, Portekizce, İtalyanca, Hintçe ve Arapça dahil olmak üzere dokuz dili destekliyor. Mistral AI Bilim Operasyonları Başkan Yardımcısı Pierre Stock, “Müşterilerimiz, bir konuşma modeli talep ediyordu. Bu sebeple, akıllı saatler, akıllı telefonlar ve dizüstü bilgisayarlar üzerinde kullanılabilen, küçük boyutlu ve yüksek performanslı bir model geliştirdik,” şeklinde açıklamada bulundu.
Model, beş saniyeden kısa bir örnek ile özel sesler oluşturabiliyor ve belirgin aksanlar, tonlamalar ve konuşma akışındaki düzensizlikleri yakalayabiliyor. Ayrıca, dublaj veya gerçek zamanlı çeviri gibi senaryolar için de dil değiştirebiliyor. Mistral, modelin insan gibi ses çıkarmasını ve robotik bir tondan uzak olmasını hedefliyor.
Gerçek Zamanlı Performans ve Verimlilik
Mistral, Voxtral TTS’nin gerçek zamanlı performansa odaklandığını belirtiyor. Modelin, girilen veriden sonra konuşmaya başlama süresi (TTFA), 10 saniyelik bir örnek için yalnızca 90 milisaniye. Ayrıca, 10 saniyelik bir klibi yaklaşık 1.6 saniyede oluşturabiliyor. Bu özellikler, işletmelerin verimliliğini artırırken, bulut bilişim ortamlarında da rahatça entegre edilmesini sağlıyor.
Mistral, daha önce de büyük hacimli dönüştürme işlemleri ve düşük gecikmeli gerçek zamanlı kullanım için iki transkript modelini piyasaya sürmüştü. Bu yeni sesli model ile birlikte, şirketin temel amacı, işletmelere yönelik tam kapsamlı bir ses ürünleri seti sunmak.
Şirket, açık kaynak ve özelleştirme özellikleri sayesinde, rekabette öne çıkmayı planlıyor. İşletmeler, modeli ihtiyaçlarına göre daha kolay bir şekilde şekillendirebiliyor. Mistral, çeşitli veri türlerini bir araya getiren bir uçtan uca platform geliştirmek için de çalışmalara devam ediyor.
Kaynak: https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/


