Şehrin ortasında, özel bir kulaklık takarak seçtiğiniz seslerin tadını çıkarabileceğiniz kalabalık bir park hayal edin: şehir gürültüsüne ve yoldan geçenlerin konuşmalarına hayır, kuşların cıvıltılarına evet ve güvenlik nedeniyle itfaiyecilerin sirenlerine. Evde, daha sıradan bir ifadeyle, böyle bir kulaklık, teslimatçının kapıyı çaldığını duyarken evi süpürmenize olanak tanır. Bu hedefe yönelik dinleme deneyimi, 1 Çarşamba günü sunulduyani Kasım ayında, Seattle’daki Washington Üniversitesi’nden makine öğrenimi (yapay zeka) ve mühendislik araştırmacıları tarafından San Francisco’da düzenlenen Kullanıcı Arayüzü Yazılımı ve Teknolojisi sempozyumunda ayrıntılı olarak anlatıldı. Bilgisayar Makineleri Birliği’nin bir makalesinde.
“Bu araştırmanın fikri, gerçek zamanlı konuşma işleme projelerinden sonra geldiÖzellikle gömülü sistemler ve makine öğrenimi üzerinde çalışan Malek Itani şöyle açıklıyor: Gerçek zamanlı olarak kulaklarımız için bir tür Photoshop uygulayıp uygulayamayacağımızı merak ettik: diğer sesleri ortadan kaldırmak ve korumak için sesleri seçin. » Bu amaç, araştırmacıyı tanır, “Modern kulaklıklar ve gürültü önleyici kulaklıklardaki etkileyici gelişmeler olmasaydı bu mümkün olamazdı”.
“Anlamsal işitme”
Somut olarak, bu araştırmacılar tüm sesleri ortadan kaldırma çalışmaları için ticari olarak satılan gürültü önleyici kulaklıkları kullandılar. Yapay zeka sistemi kullanarak, kulaklıkta yeniden üretmeden önce yalnızca kullanıcının istediği hedef sesleri (örneğin kuşlar, sirenler) filtrelediler. “Bu “anlamsal işitme” ilkesi, gerçek zamanlı olarak, mekansal ipuçlarını korurken, gerçek ortamlardan gelen belirli seslere yoğunlaşmayı sağlar., Malek Itani’yi belirtir. Bu sonuca ulaşmak için çift sesli hedef sesi çıkarabilen ilk sinir ağını tasarladık. [reçu par les deux oreilles] Sistemimizin genelleştirilebilmesi ve gerçek dünyada kullanılabilmesi için, bir öğrenme metodolojisiyle desteklediğimiz, parazit yapan sesler ve arka plan gürültüsünün varlığında. »
“Gerçek Dünyanın Öngörülemezliği” Malek Itani, aşılması gereken ilk zorluğun bu olduğunu belirtiyor. “Farklı ortamlara ve kullanıcılara uyum sağlayabilecek bir sistem yaratmamız gerekiyordu. » Diğer bir zorluk da bu sistemin, kulaklık gibi küçük bir cihaz üzerinde bir sinir ağını gerçek zamanlı olarak çalıştırması gerekmesiydi. “Bu ağlar genellikle çok fazla güç tüketen grafik kartlarında kullanılmak üzere tasarlanmıştır ve bunları taşınabilir cihazlarla yeterince verimli hale getirmek zordur.” araştırmacının altını çiziyor.
Bu makalenin okunacak %45’i kaldı. Geri kalanı abonelere ayrılmıştır.