Microsoft, yüz tanıma da dahil olmak üzere bazı yapay zekaya dayalı özellikler için genel desteğinden vazgeçiyor ve bu tekliflerin yarattığı ayrımcılık ve doğruluk sorunlarını kabul ediyor. Ancak şirketin sorunları çözmek için yılları vardı ve yapmadı. Bu, bir otomobil üreticisinin bir aracı tamir etmek yerine geri çağırmasına benzer.

Yüz tanıma teknolojisinin ayrımcı olabileceği endişelerine rağmen, asıl sorun sonuçların yanlış olmasıdır. (Ayrımcı argüman, Microsoft geliştiricilerinin bu uygulamaları oluştururken yaptığı varsayımlar nedeniyle bir rol oynar.)

Microsoft’un yaptıkları ve söyledikleriyle başlayalım. Microsoft’un Azure AI’sinin ana grup ürün yöneticisi Sarah Bird, geçen ay yaşanan geri çekilmeyi özetledi. bir Microsoft blogunda.

Bugünden itibaren (21 Haziran) geçerli olmak üzere, yeni müşterilerin Azure Face API, Computer Vision ve Video Indexer’da yüz tanıma işlemlerini kullanmak için erişim başvurusu yapması gerekiyor. Mevcut müşterilerin, sağlanan kullanım durumlarına göre yüz tanıma hizmetlerine sürekli erişim için başvurmak ve onay almak için bir yılı vardır. Sınırlı Erişim’i sunarak, bu hizmetlerin kullanımının Microsoft’un Sorumlu Yapay Zeka Standardı ile uyumlu olmasını ve yüksek değerli son kullanıcı ve toplumsal faydaya katkıda bulunmasını sağlamak için yüz tanımanın kullanımına ve dağıtımına ek bir inceleme katmanı ekledik. Bu, bu hizmetlere erişim elde etmek için kullanım senaryosu ve müşteri uygunluk gereksinimlerinin tanıtılmasını içerir.

“Bulanıklığı, pozlamayı, gözlükleri, baş pozunu, yer işaretlerini, gürültüyü, tıkanmayı ve yüz sınırlama kutusunu algılama dahil olmak üzere yüz algılama yetenekleri genel olarak kullanılabilir durumda kalacak ve herhangi bir uygulama gerektirmeyecek.”

Bird’ün, kullanıcıların “bu hizmetlerin kullanımının Microsoft’un Sorumlu Yapay Zeka Standardı ile uyumlu olmasını ve yüksek değerli son kullanıcı ve toplumsal faydaya katkıda bulunmasını sağlamak için” atlamaları için bu ek çemberi vurguladığı ikinci cümleye bakın.

Bu kesinlikle kulağa hoş geliyor, ancak bu değişikliğin gerçekten yaptığı şey bu mu? Yoksa Microsoft, yanlışlıkların en büyük olduğu yerde insanların uygulamayı kullanmasını engellemenin bir yolu olarak buna dayanacak mı?

Microsoft’un tartıştığı durumlardan biri konuşma tanımayı içerir ve burada “Microsoft’un Baş Sorumlu Yapay Zeka Görevlisi Natasha Crampton, teknoloji sektöründeki konuşmadan metne teknolojisi, bazı Siyah ve Afrikalı Amerikalı toplulukların üyeleri için beyaz kullanıcılarınkinin neredeyse iki katı olan hata oranları üretti. “Geri çekildik, çalışmanın bulgularını değerlendirdik ve yayın öncesi testlerimizin farklı geçmişlere ve farklı bölgelerden gelen insanlar arasındaki zengin konuşma çeşitliliğini tatmin edici bir şekilde açıklamadığını öğrendik.”

Microsoft’un belirlediği bir başka sorun da, tüm geçmişlere sahip kişilerin resmi ve gayri resmi ortamlarda farklı konuşma eğiliminde olmalarıdır. Yok canım? Geliştiriciler bunu daha önce bilmiyor muydu? Bahse girerim öyle yaptılar ama hiçbir şey yapmamanın sonuçlarını düşünmediler.

Bunu ele almanın bir yolu, veri toplama sürecini yeniden incelemektir. Doğası gereği, ses analizi için kaydedilen insanlar biraz gergin olacaklar ve muhtemelen katı ve sert konuşacaklar. Başa çıkmanın bir yolu, mümkün olduğunca rahat bir ortamda çok daha uzun kayıt oturumları yapmaktır. Birkaç saat sonra, bazı insanlar kaydedildiklerini unutabilir ve gündelik konuşma kalıplarına yerleşebilir.

Bunun, insanların ses tanıma ile nasıl etkileşime girdiğiyle ilgili olduğunu gördüm. İlk başta, yavaş konuşurlar ve aşırı telaffuz etme eğilimindedirler. Zamanla, yavaş yavaş “Uzay Yolu” diyeceğim duruma geçerler ve başka biriyle konuşur gibi konuşurlar.

Duygu algılama çabalarında da benzer bir sorun keşfedildi.

Bird’den daha fazlası: “Başka bir değişiklikte, cinsiyet, yaş, gülümseme, sakal, saç ve makyaj gibi duygusal durumları ve kimlik özelliklerini anlama iddiasındaki yüz analizi yeteneklerini kullanımdan kaldıracağız. Bu teknolojinin sınırlamalarını ve potansiyel faydalarını anlamak ve ödünleşimleri yönlendirmek için dahili ve harici araştırmacılarla işbirliği yaptık. Özellikle duygu sınıflandırması söz konusu olduğunda, bu çabalar mahremiyet, duyguların tanımı üzerinde fikir birliği olmaması ve yüz ifadesi ile duygusal durum arasındaki bağlantıyı kullanım durumları, bölgeler ve demografiler arasında genelleyememesiyle ilgili önemli soruları gündeme getirdi. Hassas öznitelikleri tahmin eden yeteneklere API erişimi, insanları klişeleştirmeye, ayrımcılığa veya haksız hizmet reddine maruz bırakmak da dahil olmak üzere, bunların kötüye kullanılabilecekleri çok çeşitli yollar açar. Bu riskleri azaltmak için, Face API’de duygusal durumları, cinsiyeti, yaşı, gülümsemeyi, sakalı, saçı ve makyajı çıkarmayı amaçlayan genel amaçlı bir sistemi desteklememeyi seçtik. Bu özelliklerin algılanması, 21 Haziran 2022’den itibaren yeni müşteriler tarafından artık kullanılamayacak ve mevcut müşterilerin, kullanımdan kaldırılmadan önce bu özelliklerin kullanımını durdurmak için 30 Haziran 2023’e kadar süreleri olacak.

Duygu tespitinde, yüz analizinin basit ses analizinden çok daha az doğru olduğu tarihsel olarak kanıtlanmıştır. Duygunun sesle tanınması, sesi çok kızgın çıkan bir müşterinin hemen üst düzey bir amirine aktarılabileceği çağrı merkezi uygulamalarında oldukça etkili olduğunu kanıtlamıştır.

Sınırlı bir ölçüde, bu, Microsoft’un, kısıtlanması gereken şeyin verilerin kullanılma şekli olduğuna dikkat çekmesine yardımcı olur. Bu çağrı merkezi senaryosunda, yazılım yanlışsa ve o müşteri olumsuzluk aslında kızgın, zararı yok. Süpervizör aramayı normal şekilde tamamlar. Not: Gördüğüm sesle ilgili tek yaygın duygu tespiti, müşterinin telefon ağacına kızdığı ve basit cümleleri gerçekten anlayamadığı yerdir. Yazılım, müşterinin şirkete kızgın olduğunu düşünüyor. Mantıklı bir hata.

Ama yine de yazılım yanlışsa hiçbir zararı olmaz.

Bird, bazı kullanım durumlarının bu AI işlevlerine sorumlu bir şekilde güvenebileceği konusunda iyi bir noktaya değindi. “Azure Bilişsel Hizmetler müşterileri artık Microsoft’un yüz doğrulama algoritmalarının adaletini kendi verileri üzerinde ölçmek için açık kaynaklı Fairlearn paketinden ve Microsoft’un Fairness Dashboard’undan yararlanarak farklı demografik grupları etkileyebilecek potansiyel adalet sorunlarını önceden belirlemelerine ve çözmelerine olanak tanır. teknolojilerini yayıyorlar.”

Bird ayrıca teknik sorunların bazı yanlışlıklarda rol oynadığını söyledi. “Face hizmetimizi kullanan müşterilerle çalışırken, başlangıçta adalet sorunlarına atfedilen bazı hataların düşük görüntü kalitesinden kaynaklandığını da fark ettik. Birinin gönderdiği resim çok karanlık veya bulanıksa, model onu doğru şekilde eşleştiremeyebilir. Bu düşük görüntü kalitesinin demografik gruplar arasında haksız bir şekilde yoğunlaşabileceğini kabul ediyoruz.”

Demografik gruplar arasında mı? Herkesin bir demografik gruba ait olduğu düşünülürse, bu herkes değil mi? Bu, beyaz olmayanların eşleşme işlevselliğinin zayıf olabileceğini söylemenin nazlı bir yolu gibi görünüyor. Bu nedenle kolluk kuvvetlerinin bu araçları kullanması çok sorunludur. BT’nin sorması gereken önemli bir soru: Yazılım yanlışsa sonuçları nelerdir? Yazılım, kullanılan 50 araçtan biri mi yoksa yalnızca ona mı güveniliyor?

Microsoft, bu sorunu yeni bir araçla düzeltmeye çalıştığını söyledi. Bird, “Bu nedenle Microsoft, müşterilere yüz doğrulaması için gönderilen görüntülerde aydınlatma, bulanıklık, tıkanıklık veya baş açısı ile ilgili sorunları işaretleyen yeni bir Tanıma Kalitesi API’si sunuyor” dedi. “Microsoft ayrıca, kullanıcıların doğru sonuçlar verme olasılığı daha yüksek olan daha yüksek kaliteli görüntüler yakalamalarına yardımcı olmak için gerçek zamanlı öneriler sunan bir referans uygulaması da sunuyor.”

İçinde New York Times röportaj yapmakCrampton’ın işaret ettiği bir diğer konu ise “sistemin sözde cinsiyet sınıflandırıcısı ikiliydi ve bu bizim değerlerimizle uyumlu değil.”

Kısacası, sistem sadece kadın ve erkek üzerinden düşünmekle kalmayıp, kendini başka cinsiyet biçimleriyle tanımlayan insanları kolayca etiketleyemediğini söylüyor. Bu durumda, Microsoft, muhtemelen doğru çağrı olan cinsiyeti tahmin etmeye çalışmaktan vazgeçmeyi seçti.

Telif Hakkı © 2022 IDG Communications, Inc.



genel-13