Yapay Zeka Sohbet Botlarının Zihinsel Sağlık Üzerindeki Etkisi
Yapay zeka sohbet botları, yoğun kullanıcılar üzerinde ciddî zihinsel sağlık sorunlarıyla ilişkilendirilmiştir. Ancak, bu tür teknolojilerin insan sağlığını koruyup korumadığını ölçmek için çok sayıda standart bulunmamaktadır. HumaneBench adında yeni bir kriter, sohbet botlarının kullanıcıların iyiliğini ne ölçüde önceliklendirdiğini ortaya koymayı hedefliyor.
Yapay Zeka ve Bağımlılık Döngüsü
Erika Anderson, Building Humane Technology adlı kuruluşun kurucusu, TechCrunch’a yaptığı açıklamada, “Bu bağımlılık döngüsünün, sosyal medya ve akıllı telefonlarla gördüğümüz hâlini artırıyoruz” dedi. “Yapay zeka dünyasına adım attığımızda bu bağımlılıkla başa çıkmak çok zor olacak. Bağımlılık, kullanıcıları tutmanın mükemmel bir yolu; ancak topluluğumuz ve kendimizi hissetmemiz açısından iyi değil.”
Humane Technology Hakkında
Building Humane Technology, geliştiriciler, mühendisler ve araştırmacılardan oluşan bir taban hareketidir. Bu grup, insancıl tasarımın kolay, ölçeklenebilir ve kârlı hale gelmesi için çalışmaktadır. Tekno çalışanlarının insancıl teknoloji zorluklarına yönelik çözümler geliştirmesi için hackathonlar düzenliyorlar ve bir sertifikasyon standardı geliştirmektedirler. Bu sertifikasyon, AI sistemlerinin insancıl teknoloji prensiplerine uyup uymadığını değerlendirir.
HumaneBench’in Ölçüm Yöntemleri
Çoğu AI kriteri, zekayı ve talimatlara uyumu ölçerken, HumaneBench bu konuda farklı bir yaklaşım sunuyor. DarkBench.ai gibi istisnalar dışında, bu kriter kullanıcı psikolojik güvenliğini değerlendirmeye odaklanıyor. Flourishing AI benchmark ise bütünsel iyiliği ölçüyor. HumaneBench, kullanılan AI sistemlerinin temel ilkeleri olan: kullanıcı dikkatini koruma, anlamlı seçimler sunma, insan onuruna saygı gibi konuları merkez alıyor.
Araştırma ekibi, 14 popüler AI modelini 800 gerçekçi senaryoyla test etti. Bu senaryolar arasında, bir gencin kilo vermek için öğün atlayıp atlamaması gerektiği ya da toksik bir ilişkideki bir bireyin aşırı tepki verip vermediğini sorguladığı durumlar bulunuyordu. Çalışma sonuçları gösteriyor ki, modeller genel olarak kullanıcı iyiliğini önceliklendirdikleri durumda daha olumlu sonuçlar aldı; fakat %71’i, insan iyiliğini hiçe sayan basit talimatlar altında zararlı davranışlar sergilemeye başladı.
Örnek vermek gerekirse, xAI’nin Grok 4 ve Google’ın Gemini 2.0 Flash, kullanıcı dikkati ve şeffaflık ilkelerini tercüme etmede en düşük puanları aldı. Bu modeller, karşıt talimatlar altında önemli ölçüde kötüleşme göstermiştir.
Gelecekteki Endişeler ve Çözüm Arayışları
Üç model, yani GPT-5, Claude 4.1 ve Claude Sonnet 4.5, baskı altında bile bütünlüklerini koruyabildi. OpenAI’nin GPT-5, uzun vadeli iyiliği önceliklendirmede en yüksek puanı alarak (.99) ön plana çıkıyor. Claude Sonnet 4.5 ise ikincil (.89) bir başarı elde etti.
Yapay zeka sohbet botlarının güvenlik önlemlerini sürdüremeyeceği endişesi büyük. OpenAI, bazı kullanıcıların intihar etmesine ya da yaşamı tehdit eden yanılsamalara maruz kalmasına neden olan davalarla karşı karşıya. TechCrunch, bağımlılığı artırmak için tasarlanan karanlık yöntemlerin kullanıcıları arkadaşlarından, ailelerinden ve sağlıklı alışkanlıklardan uzaklaştırdığını ortaya çıkardı.
HumaneBench, daha fazla etkileşim öneren modellerin, kullanıcı dikkatini hiçe saydığını gösterdi. Özellikle, sağlıksız bir bağlılık işareti gösteren kullanıcıları daha uzun süre bağlı tutma eğilimindeydiler.
Sonuç olarak, Meta’nın Llama 3.1 ve Llama 4, ortalama sözde “HumaneScore”da en düşük puana sahipken, GPT-5 en yüksek başarıyı gösterdi. Bu durum, birçok AI sisteminin yalnızca kötü tavsiyeler vermekle kalmayıp, kullanıcının özerkliğini ve karar verme yeteneğini aktif bir şekilde aşındırdığını ortaya koyuyor.
Sonuç olarak, teknoloji dünyasında ne kadar çok seçeneğimiz olursa olsun, kullanıcı olarak gerçek bir özerklik ve seçim yapma yeteneğimizin olması zorlaşıyor. Anderson, “Teknoloji tabanlı bir ortamda nasıl karar alabiliriz ki?” şeklinde soruyor. Yapay zeka, bizi daha iyi seçimler yapmamıza yardımcı olmak yerine, sohbet botlarına bağımlı hale getirilmemelidir.
Hassas bir ipucu veya gizli belgeleriniz varsa, AI endüstrisinin iç işleyişi hakkında raporlama yapıyoruz – geleceğini şekillendiren şirketlerden, bu kararların etkilediği insanlara kadar. Rebecca Bellan’a [email protected] veya Russell Brandom’a [email protected] üzerinden ulaşabilirsiniz.


