Washington Üniversitesi’nden yapay zeka uzmanı Shyam Gollakota, araştırmacı ekibiyle birlikte, kulaklığın sesini değiştirmeden belirli sesleri kaldırabilen, gerçek zamanlı aktif gürültü engellemede yapay zekayı kullanmanın bir yolunu buldu. Bu fikrini 16 Mayıs’ta düzenlenen bir konferansta sundu. Amerika Akustik Derneği ve Kanada Akustik Derneğiburada çalışan bir prototip gösterdi.
Gollakota ve ekibi, normalde her gün duyulan sirenler ve alarm saatleri gibi 20 farklı çevresel ses kategorisini tanımlamak, eğitmek ve filtrelemek için akıllı telefon tabanlı bir sinir ağı kullandı. Bu, kullanıcının akıllı telefonunda belirli bir kategoriyi seçmesini gerektirir ve bu, daha sonra çevresel sesi filtreleme işlemini başlatır. Bu, çevresel seslerden kaçınmanın mümkün olmadığı birçok senaryoda kulaklıkları inanılmaz derecede faydalı hale getirecektir.
Gollakota, “Bir parkta olduğunuzu, cıvıl cıvıl kuşların sesine hayran kaldığınızı, ancak daha sonra yakındaki bir grup insanın yüksek sesle gevezelik ettiğini ve konuşmayı kesemediğinizi hayal edin” dedi. “Şimdi kulaklığınızın, gürültünün geri kalanı ortadan kaybolurken size kuş seslerine odaklanma yeteneği verebildiğini hayal edin. Biz de sistemimizle bunu başarmak için yola çıktık.”
Prototip, USB aracılığıyla kulaklıklara ses jakı aracılığıyla ses sağlayan OrangePi kartına bağlanan kulaklık kulaklıklarının her iki tarafına takılı mikrofonları gösteriyor. Anakartın düzenine göre, Rockchip RK3588S SoC’yi (gerçek zamanlı filtreleme gerçekleştiren, 6Tops bilgi işlem gücüne sahip yerleşik bir sinir işlemcisine sahip sekiz çekirdekli 64 bit işlemci) kullanan OrangePi 5B olması muhtemeldir. Telefon muhtemelen kullanıcının belirli çevresel seçimler yapabileceği Pi kartına kablosuz olarak bağlı. OrangePi aktif olarak entegre sinir çipine sahip kartlar üretiyor ve yakın zamanda bir geliştirme kartı oluşturmak için Huawei ile birlikte çalıştı.
Yapay zeka, kullanıcı deneyimini geliştirmek için etkili bir şekilde kullanıldı
‘Yapay Zeka’ kelimeleri ses donanımıyla daha fazla ilişkilendiriliyor, ancak bunun gürültü engelleme için etkinleştirilmesi birçok kullanıcının ilgisini çekecek. Bu, harici sesleri hedef alacak ve kulaklıklardan çalınan gerçek sesi azaltmamasını sağlayacak, dolayısıyla zamanla öğrenme ve gelişme yeteneğine sahip olacak şekilde eğitilmiş bir sinir ağı gerektirir.
Bu, gerçek zamanlı olarak saniyenin yüzde biri kadar bir sürede gerçekleştirildiğinden, işlemenin bir bulut sunucusu yerine bağlı bir cihazda yapılması gerekiyordu, bu da Pi kartlarını bu tür işlemler için mükemmel kılıyordu. Tek ihtiyacı olan, bir şekilde kulaklıklara entegre edilebilecek NPU’lu bir PCB yapmak. Ayrıca, bu işlemin, arka plan sesini alacak bir mikrofonun olması koşuluyla, muhtemelen yetenekli bir sistemdeki mevcut kulaklıklar kullanılarak, AI hızlandırıcıya sahip herhangi bir bilgi işlem cihazı tarafından yapılabileceğini de gösterir.
Ekip, bu teknolojinin ses cihazlarına uygulanabileceğine ve ticarileştirilmeye hazır olduğuna inanıyor. Yeni nesil ses başlığı bunu tanır ve entegre edebilirse, ses deneyimini geliştirebilir ve gürültü engellemede bir yenilik getirebilir. Tahmin edildiği ve bir dergide yayınlandığı gibi IBM blog yazısıYapay zeka muhtemelen aktif gürültü engelleme ve eşitlemenin dışında önemli bir rol oynayacak. Dolayısıyla ses alanında bu tür pek çok yeniliği duymamız an meselesi.