Siri’den bir sonraki parçaya geçmesini istemek kadar kullanışlı veya en sevdiğiniz sanatçının şarkılarını yükleyin Telefonunuzu çıkarmadan, akıllı asistanlarla sözlü olarak etkileşimde bulunmanın bir seçenek olmadığı zamanlar vardır. Bu nedenle Cornell Üniversitesi’ndeki araştırmacılar, kullanıcı bir ses mırıldanmadığında bile sesli komutları algılayabilen giyilebilir bir akıllı kamera geliştirdi.

Sesle etkinleştirilen asistanların zekası ve sesli komutları zahmetsizce anlama yetenekleri yıldan yıla gelişmeye devam ediyor, ancak hepsinin başından beri çok iyi oldukları tek şey basit komutları anlamak. Apple, Google ve Amazon’dan kablosuz kulakiçi kulaklıkları tercih etmenin en iyi nedenlerinden biri, tetikleyici kelimeler aracılığıyla her şirketin akıllı asistanlarına erişmek kolaydır, bu nedenle deneyim tamamen el-Bedava.

Ancak, yüksek sesle komutlar vermek istemediğiniz (kalabalık bir metro vagonunda olduğu gibi) veya kimsenin Siri’den Celine’in en iyi şarkı listesini hazırlamasını istediğinizi bilmesini istemediğiniz zamanlar için, SpeeChin ilginç bir alternatif.

Cornell Ann S. Bowers Bilgisayar ve Bilgi Bilimleri Koleji’nde bilgi bilimi yardımcı doçenti Cheng Zhang ve Cornell Üniversitesi doktora öğrencisi Ruidong Zhang, SpeeChin tarafından tasarlandı. bir bir kolye üzerinde asılı kompakt kızılötesi kamera göğüs hizasında giyilen. Kamera yukarıyı gösterir ve kullanıcının çene hareketlerinin yüksek kontrastlı videosunu çeker; bu video, biraz eğitimden sonra birinin ne söylediğini anlamak için kullanılabilir. onlar ses çıkarmadan. Kameranın konumu, ağız hareketlerini kaydetmek için birinin yüzüne bir kamera monte etmekten daha gizli olmakla kalmaz, aynı zamanda diğer insanların yüzlerinin yakalanamayacağı bir açıda oturur ve gizlilik endişesi yaratmaz.

Araştırmacılar SpeeChin’i 20 katılımcıyla test etti; Bunlardan 10’u İngilizce olarak rakamlar ve yaygın sesli yardımcı komutlar dahil 54 basit kelime öbeği ve 10’u Mandarin Çincesi’nde 44 basit kelime ve kelime öbeği söyledi. Bir eğitim döneminden sonra, çene takip kamerası İngilizce komutları %90,5 doğrulukla ve Mandarin Çincesi komutları %91,6 doğrulukla tanıyabildi. Bu, katılımcıların sabit kalırken çeşitli cümleleri söylemesiyle oldu. Yürürken bu cümleleri söylemesi istendiğinde, yürüyüşleri de dahil olmak üzere her kişinin hareketlerindeki farklılıklar ve kafalarının ek hareketi nedeniyle doğruluk düştü.

Bu, hem ayakta duran hem de yürüyen katılımcıların tümceler ve komutlar kitaplığında çalışmasının yanı sıra çene hareketlerini daha yüksek çözünürlükte veya daha yüksek çözünürlükte daha iyi takip edebilen gelişmiş kamera ekipmanını içeren daha uzun bir eğitim oturumu ile potansiyel olarak çözülebilecek bir sorundur. kare hızları. Araştırmacıların teknolojiyi geliştirmeye devam etmesini umuyoruz, çünkü daha gelişmiş konuşma tanıma yetenekleriyle, dünya kimsenin ses çıkarmak zorunda olmadığı daha barışçıl bir yer olurdu.



genel-7

Bir yanıt yazın