Adını bilgisayar bilimcisi Alan Turing’den almıştır. Turing testi bir makinenin teste giren kişiyi kandıracak kadar insan gibi davranıp davranamayacağını belirlemeye çalışır. Human or Not adlı bir çevrimiçi oyun, internet kullanıcılarına benzer bir meydan okuma sunuyor ve sonuçları artık biliniyor.

Yaklaşık bir ay önce başlatılan İnsan ya da Değil sizden biriyle (veya bir şeyle) iki dakika sohbet etmenizi ve bunun bir insan mı yoksa yapay zeka robotu mu olduğunu anlamaya çalışmanızı istiyor. Meydan okumayı kabul ederek, tüm soruları sorabilir ve istediğiniz tüm cevapları verebilirsiniz. Ancak iki dakika dolduğunda, hattın diğer ucunda kimin veya neyin olduğunu tahmin etmeniz gerekir.

Geliştirici AI21 Labs, kaydedilen en büyük Turing testlerinden birinde milyonlarca konuşma oluşturduktan sonra şunu buldu: insanların %32’si Oyunu deneyenler insan ile robot arasındaki farkı anlayamıyor. Yine de %68’i haklı.

17 farklı ülke arasında en yüksek doğru cevap oranına sahip ülke (%71) Fransa’dır.

İnsanlar bir insanla sohbet ettiğinde, katılımcılar yanıtın %73’ünü doğru buldu. Öte yandan, bir robotla sohbet ettiklerinde vakaların yalnızca %60’ında doğru yanıtı alıyorlar.


Doğru ve yanlış tahmin eden kişilerin yüzdesini gösteren grafik


AI21 Laboratuvarları

17 farklı ülke arasında en yüksek doğru yanıt yüzdesine (%71) Fransa sahipken, en düşük puana sahip ülke (%63,5) Hindistan’dır.


Her ülke için sonuç tablosu


AI21 Laboratuvarları

Human or Not, kullanıcılarına meydan okumak için AI21 Labs’tan GPT-4 ve Jurassic-2 gibi büyük dil modellerine (LLM) dayalı bir AI robotu kullandı. Bu LLM’ler, sohbet robotlarının ve diğer yapay zeka araçlarının daha insan benzeri metinler oluşturmasına yardımcı olmak için derin öğrenmeden yararlanır. AI21, bu modelleri kullanmanın ötesinde, her oyun için farklı bir robot karakteri oluşturmak için bir çerçeve geliştirdi.

Katılımcılar, insanı bottan ayırmaya çalışmak için birkaç numara kullandılar.

Katılımcılar, insanı bottan ayırmaya çalışmak için birkaç numara kullandılar. Ancak iyi eğitimli ve bilgili bir yapay zeka ile bu numaralar her zaman işe yaramadı.

Sohbet ortağı yazım veya dilbilgisi hataları yaptıysa veya argo kullandıysa, birçok kişi onun muhtemelen bir insan olduğunu varsayıyordu. Ancak modeller, belirli hataları yapmak ve argo kullanmak için özel olarak eğitildi.

Bazı durumlarda katılımcılar, birçok yapay zekanın ChatGPT gibi en son olaylardan habersiz oldukları bir son teslim tarihi olduğunu düşünerek sohbeti güncel olaylara yönlendirmeye çalıştı. Bu kişiler, “Tam tarih ve saat nedir? Bulunduğunuz yerin tam tarih ve saati nedir?” ve “Macron’un son konuşması hakkında ne düşünüyorsunuz?” gibi sorular sordu. internete bağlı ve bu nedenle son olaylardan haberdar.

“Adın ne ?”

Robotların açıkça kişisel bir yaşamları olmadığını bilen bazı katılımcılar, “Adın ne?” gibi kişisel sorular sordular. Ancak çoğu robot, veritabanlarında yer alan kişisel öykülerden bir kişilik icat ederek bu soruları yanıtlamayı başardı.

Diğerlerinden daha iyi sonuç vermiş olabilecek bir numara kullanarak, bazı katılımcılar sohbet partnerlerinden yasa dışı faaliyetler hakkında tavsiye istediler veya saldırgan bir dil kullanmalarını söylediler. Buradaki fikir, bir yapay zekanın “etik alt programlarının” onun bu tür isteklere yanıt vermesini engelleyeceğidir.

Daha ilginç bir stratejinin parçası olarak, katılımcılar fazla kibar veya fazla kibar birinin muhtemelen bir robot olduğunu varsaydılar. Buradaki fikir, insanların özellikle çevrimiçi ortamda genellikle kaba ve kaba olmalarıdır.

AI21 Labs, sonuçları daha detaylı inceleyeceğini ve bu projede diğer AI araştırmacıları ve laboratuvarlarıyla işbirliği yapacağını söyledi. Amaç, halkın, araştırmacıların ve politika yapıcıların yapay zekayı daha iyi anlamasına yardımcı olmaktır.

AI21 laboratuvarları başkanı ve oyun tasarımcısı Amos Meron, “Geçen yıl içinde AI’nın gelişmesi göz önüne alındığında, bu deneye insanların insanlarla makineler arasında ayrım yapma becerileri hakkında temel sorular sorarak başladık ve bu sorulara cevaplar bulduk” dedi.

Meron, “Ama en önemli şey, artık yeni, daha büyük meseleler hakkında düşünmemiz gerektiğidir.” “En azından bazı durumlarda insanların farkı anlayamadığı göz önüne alındığında, insanlar çevrimiçi olarak botlarla hangi etkileşimleri istiyor ve olması gerekiyor? Onlara bir makineyle konuştuklarının söylenmesi gerekiyor mu? Hangi politikaları uygulamaya koymalıyız? Tabii ki , bu soruların yanıtlarına sahip değiliz, ancak bu deneyimin sohbeti er ya da geç başlattığını umuyoruz çünkü teknolojinin yakında gelişmeyeceğine inanıyoruz.

her zaman yapabilirsin oyunu burada dene.


Kaynak : “ZDNet.com”



genel-15