Ses tanıma, modern yaşamın hemen hemen her alanına entegre ediliyor, ancak hala büyük bir boşluk var: Azınlık dillerini konuşanlar, kalın aksanlı kişiler veya kekemelik gibi konuşma bozuklukları olanlar, uygulamaları kontrol eden, yazıya döken veya görevleri otomatikleştiren konuşma tanıma araçlarını kullanma konusunda genellikle daha az yetenekli oluyor.
Tobi Olatunjiklinik konuşma tanıma girişiminin kurucusu ve CEO’su Intron Sağlığıbu boşluğu kapatmak istiyor. Intron’un, 29 ülkeyi ve 288 aksanı temsil eden, çoğunluğu sağlık uygulayıcıları olan 18.000’den fazla katılımcıdan 3,5 milyon ses klibi (16.000 saat) üzerinde eğitilmiş algoritmasıyla Afrika’nın en büyük klinik veritabanı olduğunu iddia ediyor. Olatunji, katılımcılarının çoğunu sağlık sektöründen çekmenin, tıbbi terimlerin hedef pazarları için doğru şekilde telaffuz edilmesini ve yakalanmasını sağladığını söylüyor.
“Zaten birçok Afrika aksanı konusunda eğitim aldığımız için, erişimlerinin temel performansının kullandıkları diğer tüm hizmetlerden çok daha iyi olma olasılığı çok yüksek” dedi ve Gana, Uganda ve Güney Afrika’dan gelen verilerin arttığını ve girişimin modeli orada uygulamak konusunda kendine güvendiğini sözlerine ekledi.
Olatunji’nin sağlık teknolojisine olan ilgisi deneyiminin iki kolundan kaynaklanmaktadır. İlk olarak, Nijerya’da tıp doktoru olarak eğitim aldı ve çalıştı, burada o pazardaki sistemlerin verimsizliklerini, ne kadar çok evrak doldurulması gerektiğini ve hepsini takip etmenin ne kadar zor olduğunu ilk elden gördü.
“Birkaç yıl önce Nijerya’da doktorken, tıp fakültesindeyken ve hatta şimdi bile, insan çabalarını hak etmeyen tekrarlayan bir görevi yaparken kolayca sinirleniyorum,” dedi. “Kolay bir örnek, yaptığınız her laboratuvar siparişine bir hastanın adını yazmak zorunda kalmamızdı. Ve sadece basit bir şey, diyelim ki hastaları görüyorum ve bazı reçeteler almaları gerekiyor, bazı laboratuvar testleri yaptırmaları gerekiyor. Onlar için her siparişi elle yazmam gerekiyor. Her formda hasta adını, yaşını, tarihini ve tüm bunları tekrar tekrar tekrarlamak benim için çok sinir bozucu… Her zaman şunu soruyorum, işleri nasıl daha iyi yapabiliriz? Doktorların hayatını nasıl kolaylaştırabiliriz? Bazı görevleri alıp başka bir sisteme devredebilir miyiz, böylece doktor zamanını çok değerli şeyler yaparak geçirebilir mi?”
Bu sorular onu hayatının bir sonraki aşamasına taşıdı. Olatunji, öncelikle San Francisco Üniversitesi’nde tıbbi bilişim alanında yüksek lisans derecesi ve ardından Georgia Tech’te bilgisayar bilimi alanında bir yüksek lisans derecesi almak için ABD’ye taşındı.
Daha sonra bir dizi teknoloji şirketinde deneyim kazandı. San Francisco Körfez Bölgesi şirketi Enlitic’te klinik doğal dil programlama (NLP) bilim insanı ve araştırmacısı olarak, radyoloji metin raporlarından bilgi çıkarmayı otomatikleştirmek için modeller oluşturdu. Ayrıca Amazon Web Services’ta makine öğrenimi bilim insanı olarak görev yaptı. Hem Enlitic’te hem de Amazon’da, hastanelerin daha iyi çalışmasını sağlayan sistemleri şekillendirerek sağlık hizmetleri için doğal dil işleme üzerine odaklandı.
Bu deneyimler boyunca, ABD’de geliştirilen ve kullanılanların Nijerya ve benzeri diğer gelişmekte olan pazarlarda sağlık hizmetlerinin iyileştirilmesinde nasıl kullanılabileceği konusunda fikirler oluşturmaya başladı.
2020’de başlatılan Intron Health’in orijinal amacı, Elektronik Tıbbi Kayıt (EMR) Sistemi aracılığıyla Afrika’daki hastane operasyonlarını dijitalleştirmekti. Ancak uygulama zorluydu: Olatunji, doktorların daktilo yazmaktansa yazmayı tercih ettiğini söyledi.
Bu onu daha temel bir sorunu nasıl iyileştirebileceğini araştırmaya yöneltti: Doktorların temel veri girişi, yazma, nasıl daha iyi çalışır hale getirilebilir. Şirket ilk başta not alma gibi görevleri otomatikleştirmek ve mevcut konuşmayı metne dönüştürme teknolojilerini EMR programına yerleştirmek için üçüncü taraf çözümlerine baktı.
Ancak sürekli yanlış transkripsiyon nedeniyle birçok sorun vardı. Olatunji için kalın Afrika aksanlarının ve karmaşık tıbbi terimlerin ve isimlerin telaffuzunun mevcut yabancı transkripsiyon araçlarının benimsenmesini pratik olmaktan çıkardığı açıktı.
Bu, Afrika aksanlarını tanıyabilen ve mevcut EMR’lere entegre edilebilen Intron Health’in konuşma tanıma teknolojisinin doğuşunu işaret etti. Araç bugüne kadar Kenya ve Nijerya dahil olmak üzere beş pazardaki 30 hastanede benimsendi.
Bazı anında olumlu sonuçlar elde edildi. Olatunji, bir vakada Intron Health’in Batı Afrika’nın en büyük hastanelerinden birinde radyoloji sonuçları için bekleme süresini 48 saatten 20 dakikaya düşürmeye yardımcı olduğunu söyledi. Bu tür verimlilikler, özellikle doktor-hasta oranının dünyadaki en düşük oranlardan biri olmaya devam ettiği Afrika’da sağlık hizmeti sunumunda kritik öneme sahiptir.
“Hastaneler ekipman ve teknolojiye zaten çok fazla para harcadılar… Bu teknolojiyi uyguladıklarından emin olmak önemli. EMR sisteminin benimsenmesini iyileştirmelerine yardımcı olmak için değer sağlayabiliyoruz” dedi.
İleriye bakıldığında, girişim, 1,6 milyon dolarlık ön tohum turuyla desteklenen yeni büyüme sınırlarını keşfediyor. Microtraction’a Plug and Play Ventures, Jaza Rift Ventures, Octopus Ventures, Africa Health Ventures, OpenseedVC, Pi Campus, Alumni Angel, Baker Bridge Capital ve çeşitli melek yatırımcılar katıldı.
Teknoloji açısından, Intron Health gürültü engellemeyi mükemmelleştirmek ve platformun düşük bant genişliklerinde bile iyi çalışmasını sağlamak için çalışıyor. Bu, çok konuşmacılı konuşmaların yazıya geçirilmesini sağlamanın ve metinden sese yeteneklerini entegre etmenin yanı sıra.
Olatunji, planın reçete veya laboratuvar testleri gibi görevler için istihbarat sistemleri veya karar destek araçları eklemek olduğunu söylüyor. Bu araçların, doktor hatalarını azaltmaya yardımcı olabileceğini ve işlerini hızlandırmanın yanı sıra yeterli hasta bakımı sağlayabileceğini ekliyor.
Intron Health, saniyeler içinde notlar oluşturarak klinisyenler için idari görevleri azaltan Microsoft’un DAX Express’i de dahil olmak üzere tıbbi alanda artan sayıdaki üretken AI girişimleri arasındadır. Bu teknolojilerin ortaya çıkması ve benimsenmesi, küresel konuşma ve ses tanıma pazarının 2024’ten itibaren %23,7’lik bir CAGR’nin ardından 2032’ye kadar 84,97 milyar dolar değerinde olmasının öngörülmesiyle birlikte geldi. Fortune İş Görüşleri.
Ses teknolojileri inşa etmenin ötesinde, Intron Afrika’daki konuşma araştırmalarında da önemli bir rol oynuyor ve yakın zamanda Google Research, Bill & Melinda Gates Vakfı ve PATH’deki Digital Square ile ortaklık kurarak 15 ülkede OpenAI’nin GPT-4o, Google’ın Gemini ve Anthropic’in Claude gibi popüler Büyük Dil Modellerini (LLM’ler) değerlendirerek LLM’lerdeki güçlü yönleri, zayıflıkları ve önyargı veya zarar risklerini belirliyor. Tüm bunlar, Afrika klinikleri ve hastaneleri için kültürel olarak uyumlu modellerin mevcut olmasını sağlama çabasıdır.