Amazon, 2019’da Alexa asistanını, bir müşterinin ne zaman hayal kırıklığına uğradığını tespit etme ve orantılı olarak daha fazla sempatiyle yanıt verme olanağı sağlayan bir özellikle yükseltti. Örneğin bir müşteri Alexa’dan bir şarkı çalmasını isterse ve şarkı yanlış şarkıyı sıraya koyarsa ve ardından müşteri üzgün bir ses tonuyla “Hayır, Alexa” derse, Alexa özür dileyebilir ve bir açıklama isteyebilir.
Şimdi, metinden görüntüye modeli Stable Diffusion’ı eğitmek için kullanılan veri kümelerinden birinin arkasındaki grup, her geliştiriciye benzer duygu algılama yeteneklerini hiçbir ücret ödemeden sunmak istiyor.
Bu hafta, Kararlı Yayılım da dahil olmak üzere üretken yapay zekanın eğitimi için kar amacı gütmeyen bina görseli ve metin veri setleri LAION, şunları duyurdu: Açık Empatik proje. Open Empathic, grubun ifadesiyle “açık kaynaklı yapay zeka sistemlerini empati ve duygusal zekayla donatmayı” amaçlıyor.
LAION kurucu ortağı Christoph Schuhmann, TechCrunch’a e-posta yoluyla şunları söyledi: “Sağlık, eğitim ve makine öğrenimi araştırmalarında geçmişi olan LAION ekibi, açık kaynak topluluğunda bir boşluk gördü: duygusal yapay zeka büyük ölçüde göz ardı edildi.” “LAION’un doğuşuna yol açan şeffaf olmayan yapay zeka tekelleriyle ilgili endişelerimiz gibi, burada da benzer bir aciliyet hissettik.”
LAION, Open Empathic aracılığıyla, insan duygularını “anlayan” sohbet robotları ve metinden konuşmaya modeller de dahil olmak üzere yapay zeka oluşturmak için kullanılabilecek bir veri tabanına ses klipleri gönderecek gönüllüleri işe alıyor.
Schuhmann, “OpenEmpathic ile amacımız sadece kelimeleri anlamanın ötesine geçen bir yapay zeka yaratmaktır” diye ekledi. “İfadelerdeki ve ton değişimlerindeki nüansları kavramayı, insan-yapay zeka etkileşimlerini daha özgün ve empatik hale getirmeyi hedefliyoruz.”
“Büyük Ölçekli Yapay Zeka Açık Ağı”nın kısaltması olan LAION, 2021’in başlarında, Alman lise öğretmeni olan Schuhmann ve yapay zeka meraklılarına yönelik bir Discord sunucusunun birkaç üyesi tarafından kuruldu. Stable Diffusion’ın arkasındaki tedarikçi olan AI startup’ı Hugging Face and Stability AI’nin de aralarında bulunduğu bağışlar ve kamu araştırma hibeleri tarafından finanse edilen LAION’un misyonunun, eğitim verilerinden başlayarak AI araştırma ve geliştirme kaynaklarını demokratikleştirmek olduğu belirtildi.
LAION’a açık kaynak katkısında bulunan ve doktora derecesine sahip Kari Noriy, “Açık bir misyonla hareket ediyoruz: Yapay zekanın gücünden topluma gerçekten fayda sağlayacak şekillerde yararlanmak” dedi. Bournemouth Üniversitesi’ndeki öğrenci, TechCrunch’a e-posta yoluyla söyledi. “Şeffaflık konusunda tutkuluyuz ve yapay zekayı şekillendirmenin en iyi yolunun açıkta olduğuna inanıyoruz.”
Bu nedenle Açık Empatik.
Projenin ilk aşaması için LAION, gönüllülere, konuşan bir kişinin YouTube kliplerine (bazıları LAION ekibi tarafından önceden seçilmiş, diğerleri ise gönüllüler tarafından seçilmiş) açıklama ekleme görevi veren bir web sitesi oluşturdu. Her klip için gönüllüler, klibin transkripsiyonu, ses ve video açıklaması ve klipteki kişinin yaşı, cinsiyeti, aksanı (örneğin “İngiliz İngilizcesi”), uyarılma düzeyi (uyanıklık — Olumsuz açık olmak gerekirse cinsel) ve değerlik düzeyi (“hoşluk”a karşı “hoş olmayanlık”).
Formdaki diğer alanlar, klibin ses kalitesi ve yüksek arka plan seslerinin varlığı (veya yokluğu) ile ilgilidir. Ancak büyük bir kısmı kişinin duygularına ya da en azından gönüllülerin sahip olduklarını algıladıkları duygulara odaklanıyor.
Gönüllüler, bir dizi açılır menüden “cıvıl cıvıl”, “canlı” ve “aldatıcı”dan “düşünceli” ve “ilgi çekici”ye kadar değişen bireysel veya birden fazla duyguyu seçebilir. Kari, amacın çeşitli dil ve kültürlerdeki ifadeleri yakalarken “zengin” ve “duygusal” ek açıklamalar istemek olduğunu söylüyor.
Kari, “Çok çeşitli dilleri kavrayabilen ve farklı kültürel ortamları gerçekten anlayabilen yapay zeka modellerini eğitmeye odaklanıyoruz” dedi. “Gerçek duyguları ve ifadeleri gösteren videolar kullanarak, dilleri ve kültürleri ‘anlayan’ modeller yaratmaya çalışıyoruz.
Gönüllüler LAION’un veri tabanına bir klip gönderdiklerinde süreci yeniden tekrarlayabilirler; tek bir gönüllünün açıklama ekleyebileceği klip sayısında bir sınırlama yoktur. LAION, önümüzdeki birkaç ay içinde yaklaşık 10.000, gelecek yıla kadar ise 100.000 ila 1 milyon arasında örnek toplamayı umuyor.
Kari, “Yapay zeka modellerini ve veri kümelerini demokratikleştirme vizyonuyla hareket eden ve boş zamanlarında isteyerek açıklamalara katkıda bulunan tutkulu topluluk üyelerimiz var” dedi. “Onların motivasyonu, herkesin erişebileceği, empatik ve duygusal açıdan akıllı, açık kaynaklı bir yapay zeka yaratmanın ortak hayalidir.”
Duygu tespitinin tuzakları
Amazon’un Alexa ile yaptığı girişimlerin yanı sıra, start-up’lar ve teknoloji devleri, satış eğitiminden uyuşukluğun neden olduğu kazaları önlemeye kadar çeşitli amaçlar için duyguları algılayabilen yapay zeka geliştirmeyi araştırdılar.
2016 yılında Apple, yüz ifadelerini analiz eden yapay zeka algoritmaları üzerinde çalışan bir San Diego firması olan Emotient’i satın aldı. Geçtiğimiz Mayıs ayında İsveç merkezli Smart Eye tarafından ele geçirilen, MIT’nin yan kuruluşu olan Affectiva, bir zamanlar teknolojisinin konuşmadaki öfkeyi veya hayal kırıklığını 1,2 saniyede tespit edebildiğini iddia etmişti. Microsoft’un Nisan 2021’de satın aldığı konuşma tanıma platformu Nuance, otomobillere yönelik olarak sürücünün duygularını yüz işaretlerinden analiz eden bir ürünün tanıtımını yaptı.
Gelişmekte olan duygu algılama ve tanıma alanındaki diğer oyuncular arasında, belirli izleyici kesimlerinin belirli reklamlara nasıl tepki verdiğini ölçmek için teknolojileri uygulanan Hume, HireVue ve Realeyes yer alıyor. Bazı işverenler duygu tespit teknolojisini kullanıyor potansiyel çalışanları değerlendirin onlara puan vererek empati Ve duygusal zeka. Okullar bunu öğrencilerin katılımını izlemek için kullandı sınıfta – ve uzaktan evde. Ve duygu tespit eden yapay zeka, hükümetler tarafından şunları tanımlamak için kullanıldı:tehlikeli insanlar”ve sınır kontrol duraklarında test edildi ABD, Macaristan, Letonya ve Yunanistan.
LAION ekibi, teknolojinin robotik, psikoloji, mesleki eğitim, eğitim ve hatta oyun alanlarında yararlı, sorunsuz uygulamalarını öngörüyor. Christoph, destek ve arkadaşlık sunan robotların, birinin yalnız veya endişeli hissettiğini hisseden sanal asistanların ve psikolojik bozuklukların teşhisine yardımcı olan araçların resmini çiziyor.
Bu bir tekno ütopyası. Sorun şu ki çoğu duygu tespiti sallantılı bilimsel temellere dayanıyor.
Varsa bile çok az sayıda evrensel duygu belirteci mevcut; bu da duyguyu algılayan yapay zekanın doğruluğunu sorguluyor. Duygu tespit sistemlerinin çoğunluğu, psikolog Paul Ekman’ın 70’lerde yayınlanan çalışmasına dayanıyordu. Ancak daha sonra yapılan araştırmalar (Ekman’ınki de dahil) farklı kökenden gelen insanların hissettiklerini ifade etme şekillerinde büyük farklılıklar olduğu yönündeki sağduyulu düşünceyi destekliyor.
Örneğin, ifade sözde Korku için evrensel olan, Malezya’da tehdit veya öfkeye ilişkin bir stereotiptir. Daha sonraki çalışmalarından birinde Ekman, Amerikalı ve Japon öğrencilerin şiddet içeren filmlere çok farklı tepki verme eğiliminde olduklarını, Japon öğrencilerin odada başka biri, özellikle de bir otorite figürü olması durumunda “tamamen farklı ifadeler” benimsediklerini öne sürdü.
Sesler ayrıca engelli kişiler, otizm gibi durumlar ve Afro-Amerikan Yerel İngilizcesi (AAVE) gibi diğer dil ve lehçelerde konuşan kişiler de dahil olmak üzere çok çeşitli özellikleri kapsamaktadır. İngilizce bir ankete katılan anadili Fransızca olan bir kişi, bir kelimeyi tereddütle duraklatabilir veya telaffuz edebilir; bu, tanıdık olmayan biri tarafından bir duygu belirteci olarak yanlış anlaşılabilir.
Aslında, duygu tespit eden yapay zeka ile ilgili sorunun büyük bir kısmı önyargıdır; katkıları duygu tespit modellerini eğitmek için kullanılan açıklayıcıların getirdiği örtülü ve açık önyargı.
2019’da çalışmakÖrneğin bilim adamları, etiketleyicilerin AAVE’deki ifadelere genel Amerikan İngilizcesi eşdeğerlerinden daha fazla açıklama ekleme olasılığının daha yüksek olduğunu buldu. Cinsel yönelim ve cinsiyet kimliği ağır bir şekilde etkilemek Bir açıklama yapan kişinin hangi kelime ve ifadeleri de zehirli olarak algıladığı ve doğrudan önyargı oluşturabileceği. Yaygın olarak kullanılan çeşitli açık kaynak görüntü veri setlerinin ırkçı, cinsiyetçi ve diğer türden içerikli olduğu tespit edilmiştir. saldırgan ek açıklama yapanların etiketleri.
Aşağı yöndeki etkiler oldukça dramatik olabilir.
Yapay zeka işe alım platformu Retorio’nun, gözlük ve başörtüsü gibi farklı kıyafetler giyen aynı adaya farklı tepkiler verdiği görüldü. 2020 MIT’de çalışmakAraştırmacılar, yüz analiz algoritmalarının gülümseme gibi belirli yüz ifadelerine karşı önyargılı hale gelebileceğini ve bu ifadelerin doğruluğunu azaltabileceğini gösterdi. Daha güncel iş Bu, popüler duygusal analiz araçlarının Siyah erkeklerin yüzlerine beyaz yüzlerden daha fazla olumsuz duygu atama eğiliminde olduğunu ima ediyor.
Sürece saygı duymak
Peki LAION ekibi bu önyargılarla nasıl mücadele edecek; örneğin veri setinde beyazların sayısının Siyahlardan fazla olmadığından emin olacak; ikili olmayan insanlara yanlış cinsiyet atanmadığını; ve duygudurum bozukluğu olanların ifade etmeyi amaçlamadıkları duygularla yanlış etiketlenmediğini?
Tamamen net değil.
Christoph, Open Empathic için eğitim verileri gönderim sürecinin “açık bir kapı” olmadığını ve LAION’un “katkıların bütünlüğünü sağlamak” için sistemlere sahip olduğunu iddia ediyor.
“Kullanıcının niyetini doğrulayabilir ve ek açıklamaların kalitesini sürekli olarak kontrol edebiliriz” diye ekledi.
Ancak LAION’un önceki veri setleri pek de bozulmamış değildi.
Bazı analizler ile ilgili Grubun otomatik araçlarla oluşturmaya çalıştığı LAION görüntü eğitim setlerinden biri olan LAION ~400M, cinsel saldırı, tecavüz, nefret sembolleri ve grafik şiddet içeren fotoğrafları ortaya çıkardı. LAION ~400M aynı zamanda bol Önyargılı bir şekilde, örneğin “CEO” gibi kelimeler için kadın olmayan ancak erkek resimlerinin ve “terörist” kelimesi için Orta Doğulu erkeklerin resimlerinin döndürülmesi gibi.
Christoph bu gidişatı kontrol etmek için topluluğa güveniyor.
“Dünyanın her yerinden hobi bilim adamlarının ve meraklılarının bir araya gelerek veri setlerimize katkıda bulunma gücüne inanıyoruz” dedi. “Açık ve işbirlikçi olsak da verilerimizde kaliteye ve özgünlüğe öncelik veriyoruz.”
Açık Empatik veri seti üzerinde eğitilen herhangi bir duygu tespit eden yapay zekanın (önyargılı veya hayır) nasıl kullanıldığı konusunda LAION, yapay zekanın kötüye kullanılabileceği anlamına gelse bile açık kaynak felsefesini sürdürme niyetindedir.
LAION kurucu ortağı ve Münih Teknik Üniversitesi’nde doktor olan Robert Kaczmarczyk, e-posta yoluyla şunları söyledi: “Duyguları anlamak için yapay zekayı kullanmak güçlü bir girişim, ancak zorlukları da yok değil.” “Herhangi bir araç gibi, hem iyi hem de kötü amaçlarla kullanılabilir. Halkın büyük bir kısmının karanlıktayken sadece küçük bir grubun ileri teknolojiye erişebildiğini hayal edin. Bu dengesizlik, bu teknoloji üzerinde kontrol sahibi olan az sayıda kişinin kötüye kullanılmasına ve hatta manipülasyonuna yol açabilir.”
Yapay zeka söz konusu olduğunda, bırakınız yapsınlar yaklaşımları bazen modelin yaratıcılarını ısırmaya başlar; bu, Stabil Difüzyonun artık oluşturmak için nasıl kullanıldığıyla kanıtlanmıştır. çocuk cinsel istismarı materyali ve rıza dışı deepfake’ler.
Avrupa Dijital Hakları ve Access Now da dahil olmak üzere bazı gizlilik ve insan hakları savunucuları, isminde için duygu tanımaya genel bir yasak. Yakın zamanda yürürlüğe giren ve yapay zeka için bir yönetişim çerçevesi oluşturan Avrupa Birliği yasası olan AB Yapay Zeka Yasası, polislik, sınır yönetimi, işyerleri ve okullarda duygu tanımanın kullanılmasını yasaklıyor. Ve bazı şirketler gönüllü olarak çekti kamuoyunun tepkisi karşısında Microsoft gibi duygu algılayan yapay zekaları.
Ancak LAION, içerdiği risk düzeyi konusunda rahat görünüyor ve açık geliştirme sürecine güveniyor.
Kaczmarczyk, “Araştırmacıların araştırma yapmasını, değişiklik önermesini ve sorunları tespit etmesini memnuniyetle karşılıyoruz” dedi. “Ve tıpkı Vikipedi’nin topluluk katkılarıyla büyümesi gibi, OpenEmpathic de topluluğun katılımıyla güçleniyor ve şeffaf ve güvenli olmasını sağlıyor.”
Şeffaf? Elbette. Güvenli? Zaman gösterecek.