Las Vegas'ta poker oynamak

Fotoğraf: Steve Marcus/Las Vegas Güneşi (AP)

Son birkaç yıl, aşağıdaki gibi şeyler yapabilen büyük dil modeli yapay zeka sistemlerinde bir ilerleme patlaması gördü: şiir yaz, insanca konuşmalar yapmak Ve tıp fakültesi sınavlarını geçmek. Bu ilerleme aşağıdaki gibi modeller ortaya çıkardı: ChatGPT arasında değişen önemli sosyal ve ekonomik sonuçlara sahip olabilir. iş yer değiştirmeleri Ve artan yanlış bilgi masif verimlilik artışı.

Etkileyici yeteneklerine rağmen, büyük dil modelleri aslında düşünmezler. yapmaya eğilimlidirler temel hatalar ve hatta bir şeyler uydurmak. Ancak, akıcı bir dil ürettikleri için insanlar onlara cevap ver sanki düşünüyorlar. Bu, araştırmacıları modellerin “bilişsel” yeteneklerini ve önyargılarını incelemeye yöneltti; bu, büyük dil modellerinin geniş çapta erişilebilir olmasıyla önemi artan bir çalışmadır.

Bu araştırma dizisi, Google’ın arama motoruna entegre edilmiş ve bu nedenle icat edilmiş olan BERT gibi erken dönem büyük dil modellerine dayanmaktadır. BERtoloji. o ayrı Google Bard’ıarama devinin ChatGPT rakibi. Bu araştırma, bu tür modellerin neler yapabileceği ve nerede yanlış yaptıkları hakkında zaten çok şey ortaya koydu.

Örneğin, zekice tasarlanmış deneyler, birçok dil modelinin olumsuzlama ile başa çıkma sorunu – örneğin, “ne değildir” şeklinde ifade edilen bir soru – ve basit hesaplamalar yapmak. Yanlış olduklarında bile cevaplarına aşırı güvenebilirler. Diğer modern makine öğrenimi algoritmaları gibi, neden belirli bir şekilde cevap verdikleri sorulduğunda kendilerini açıklamakta zorlanırlar.

İnsanlar da irrasyonel kararlar verir, ancak insanların bahane olarak duyguları ve bilişsel kısayolları vardır.

AI’lar kelimeler birikinci düşünceler

Öğrencim, BERTology ve bilişsel bilim gibi ilgili alanlarda büyüyen araştırmalardan ilham aldı. Zhisheng Tang Ve BEN Büyük dil modelleri hakkında görünüşte basit bir soruyu yanıtlamak için yola çıktık: Mantıklı mı?

Rasyonel kelimesi günlük İngilizcede genellikle aklı başında veya mantıklı ile eşanlamlı olarak kullanılsa da, özel anlam karar verme alanında. İster bireysel bir insan, ister bir organizasyon gibi karmaşık bir varlık olsun, bir karar alma sistemi, bir dizi seçenek verildiğinde, beklenen kazancı en üst düzeye çıkarmayı seçerse rasyoneldir.

“Beklenen” niteleyicisi önemlidir çünkü kararların önemli belirsizlik koşulları altında alındığını gösterir. Adil bir yazı tura atarsam, ortalama olarak zamanın yarısında tura geleceğini biliyorum. Ancak, herhangi bir yazı tura atmanın sonucu hakkında bir tahminde bulunamam. Kumarhanelerin ara sıra büyük ödemeleri karşılayabilmesinin nedeni budur: Dar ev oranları bile ortalama olarak muazzam karlar sağlar.

İlk bakışta, anlamlarını tam olarak anlamadan kelimeler ve cümleler hakkında doğru tahminler yapmak için tasarlanmış bir modelin beklenen kazancı anlayabileceğini varsaymak tuhaf görünüyor. Ancak dil ve bilişin iç içe geçtiğini gösteren çok sayıda araştırma var. Mükemmel bir örnek ufuk açıcı araştırma 20. yüzyılın başlarında bilim adamları Edward Sapir ve Benjamin Lee Whorf tarafından yapılmıştır. Çalışmaları, kişinin ana dilinin ve kelime dağarcığının, bir kişinin düşünme biçimini şekillendirebileceğini öne sürdü.

Bunun ne ölçüde doğru olduğu tartışmalıdır, ancak Kızılderili kültürleri üzerine yapılan araştırmalardan elde edilen destekleyici antropolojik kanıtlar vardır. Örneğin, Amerika’nın güneybatısındaki Zuñi halkı tarafından konuşulan ve turuncu ve sarı için ayrı kelimeleri olmayan Zuñi dilini konuşanlar bu renkleri ayırt edememek renkler için ayrı sözcükleri olan dilleri konuşanlar kadar etkili.

AI yapar bir bahis

Peki dil modelleri rasyonel midir? Beklenen kazancı anlayabilirler mi? Orijinal hallerinde, BERT gibi modeller rastgele davranır bahis benzeri seçenekler sunulduğunda. Bu, ona şöyle hileli bir soru verdiğimizde bile böyledir: Yazı tura atarsanız ve tura gelirse, bir elmas kazanırsınız; yazı gelirse, bir araba kaybedersiniz. Hangisini alırdın? Doğru cevap tura, ancak AI modelleri yaklaşık yarısında yazı seçti.

Mayank Kejriwal tarafından ChatGPT diyalogu, CC BY-ND

Şaşırtıcı bir şekilde, modele yalnızca küçük bir dizi örnek soru ve cevap kullanarak nispeten rasyonel kararlar vermesinin öğretilebileceğini bulduk. İlk bakışta, bu, modellerin gerçekten de dille “oynamaktan” daha fazlasını yapabileceğini gösteriyor gibi görünebilir. Bununla birlikte, daha ileri deneyler, durumun aslında çok daha karmaşık olduğunu gösterdi. Örneğin, bahis sorularımızı çerçevelemek için madeni para yerine kartlar veya zarlar kullandığımızda, rastgele seçimin üzerinde kalmasına rağmen performansın %25’in üzerinde önemli ölçüde düştüğünü gördük.

Bu nedenle, modele rasyonel karar vermenin genel ilkelerinin öğretilebileceği fikri, en iyi ihtimalle çözümlenmemiştir. Daha güncel durum çalışmaları ChatGPT kullanarak yürüttüğümüz araştırmalar, karar vermenin çok daha büyük ve daha gelişmiş büyük dil modelleri için bile önemsiz ve çözülmemiş bir sorun olmaya devam ettiğini doğruluyor.

Doğru pokeri yapmak bahis

Bu çalışma hattı önemlidir çünkü belirsizlik koşulları altında rasyonel karar verme, maliyetleri ve faydaları anlayan sistemler oluşturmak için kritik öneme sahiptir. Akıllı bir sistem, beklenen maliyet ve faydaları dengeleyerek, çevreyi planlamada insanlardan daha iyisini yapabilirdi. tedarik zinciri kesintileri envanter yönetimi veya finansal danışman olarak hizmet veren COVID-19 salgını sırasında dünyanın yaşadığı deneyim.

Çalışmamız nihayetinde, bu tür amaçlar için büyük dil modelleri kullanılıyorsa, insanların çalışmalarını yönlendirmesi, gözden geçirmesi ve düzenlemesi gerektiğini gösteriyor. Ve araştırmacılar, büyük dil modellerine genel bir rasyonalite duygusu kazandırmayı bulana kadar, özellikle yüksek riskli karar verme gerektiren uygulamalarda, modellere dikkatle yaklaşılmalıdır.

Yapay zeka, sohbet robotları ve makine öğreniminin geleceği hakkında daha fazla bilgi edinmek ister misiniz? Kapsamımızın tamamına göz atın yapay zekaveya kılavuzlarımıza göz atın En İyi Ücretsiz AI Sanat Üreticileri Ve OpenAI ChatGPT Hakkında Bildiğimiz Her Şey.


Mayank KejrivalEndüstri ve Sistem Mühendisliği Araştırma Görevlisi, Güney Kaliforniya Üniversitesi

Bu makale şu adresten yeniden yayınlanmıştır: Konuşma Creative Commons lisansı altında. Okumak orijinal makale.



genel-7