Microsoft, son iki yılı Teams’e gösterişli yeni üretkenlik özellikleri ekleyerek geçirdi ve şimdi şirket, AI sayesinde temellerin nasıl çalıştığını elden geçiriyor. Hepimiz, birinin oda akustiğinin onları duymayı zorlaştırdığı veya iki kişinin aynı anda konuşmaya çalıştığını ve garip bir “hayır, sen devam et” anı yarattığı bir görüşme yaptık. Microsoft’un yeni AI destekli ses kalitesi iyileştirmeleri, bu günlük sıkıntıları iyileştirmeli ve hatta ortadan kaldırmalıdır.
Microsoft artık oda akustiğini iyileştirmek için bir makine öğrenimi modelleri kullanıyor, böylece artık bir mağarada saklanıyormuş gibi ses çıkarmayacaksınız. “Teams’te gerçekten iyi bir iş çıkarmak için dijital sinyal işleme ile elimizden gelenin en iyisini yapmaya çalışırken, tüm farklı cihazlardan gelen yankıyı gerçekten azaltabileceğiniz yankı iptali oluşturmak için ilk kez makine öğrenimini kullanmaya başladık,” diye açıklıyor. Microsoft’ta akıllı konuşma ve iletişim bulutu için ana program yöneticisi olan Robert Aichner, bir röportajda Sınır.
Microsoft, Teams kullanıcılarının çağrı kalitesindeki yankı azalmasını ve iyileştirmeleri fark etmelerini sağlamak için modellerini gerçek dünyada ölçerek aylardır bunu test ediyor. Yazılım üreticisi, modellerini eğitmeye yardımcı olmak için 30.000 saatlik konuşma kullandı ve Teams kullanıcılarına seslerini kaydetmeleri ve cihazlarından ses çalmaları için ödeme yapılan kitle kaynak kullanımı yoluyla binlerce cihazı ele geçirdi.
Aichner, “Ayrıca yaklaşık 100.000 farklı odayı simüle ediyoruz… oda akustiği yankı iptalinde büyük rol oynuyor” diyor. Sonuç, arama ses kalitesinde büyük iyileştirmeler ve aynı anda birden fazla kişinin konuşmasına izin veren yankının ortadan kaldırılmasıdır. Yukarıdaki videoda tüm iyileştirmeleri çalışırken görebilirsiniz.
Teams, sesin bir odada sıçradığını veya yankılandığını ve sığ sese neden olduğunu algılarsa, model ayrıca yakalanan sesi dönüştürür ve Teams katılımcıları yankı karmaşası yerine yakın mesafeli bir mikrofona konuşuyormuş gibi ses çıkarmak için işleyecektir.
En etkileyici kısım, insanların Teams aramalarında, yankı nedeniyle diğer kişiyi duyamayacağınız garip örtüşme olmadan şimdi birbirlerini kesme yeteneğidir. Microsoft, daha önce AI tabanlı gürültü bastırma ile yaptığı iyileştirmelerin yanı sıra tüm bu çalışmaları Teams’de gönderiyor. Tüm işlemler, bulut yerine istemci cihazlarda yerel olarak yapılır.
Aichner, “Bunu istemcide yapmak istediğimizi söyledik, çünkü bulutta işlenen her aramayı yapmak istiyorsanız bulut hala pahalıdır… ve tabii ki bu maliyeti müşteriye yansıtmamız gerekir,” diye açıklıyor. Bu, potansiyel olarak bu önemli Teams iyileştirmelerinin ödeme yapan müşterilerle sınırlandırılması anlamına gelir ve cihazdaki rota, Teams kullanan cihazların yüzde 90’ında gürültü bastırma gibi özelliklerin mevcut olduğu anlamına gelir.
Tüm bu yeni Microsoft Teams geliştirmeleri, videolardaki metinler için bazı gerçek zamanlı ekran optimizasyonları ve video veya ekran paylaşımı çağrıları sırasında bant genişliği kısıtlamalarına yönelik AI tabanlı iyileştirmelerin yanı sıra artık yayında.

