Yapay Zeka Sohbet Robotları Star Trek Karakterleri Gibi Davrandıklarında Matematikte Daha İyi

Chatbotlar için matematik son sınırdır. Yapay zeka dil modelleri, istatistikleri kullanarak yanıtlar üretir ve çoğunlukla tatmin edici olması muhtemel bir yanıt sunar. Amaç makul bir cümle olduğunda bu harika işe yarar, ancak bu, sohbet robotlarının tam olarak tek bir doğru cevabın olduğu matematik gibi sorularla mücadele ettiği anlamına gelir.

Neden Herkes Yapay Zeka Şirketlerine Dava Açıyor? | Geleceğin Teknolojisi

Giderek artan sayıda kanıt, yapay zekaya dostane bir teşvik verirseniz daha iyi sonuçlar alabileceğinizi gösteriyor ancak yeni bir çalışma, bu tuhaf gerçeği daha da ileriye taşıyor. Yazılım şirketi VMware’in araştırması, modellere açıkmış gibi davranmalarını söylediğinizde sohbet robotlarının matematik sorularında daha iyi performans gösterdiğini gösteriyor Yıldız Savaşları.

Yazarlar makalede şöyle yazdı: “İstemde yapılan önemsiz değişikliklerin performansta bu kadar dramatik dalgalanmalar sergilemesi hem şaşırtıcı hem de rahatsız edici.” Yeni Bilim Adamı.

ÇalışmaarXiv’de yayınlandı, yola çıkmadı Yıldız Savaşları ana direktifi olarak. Önceki araştırmalar, sohbet robotlarının, teklif verdiğinizde matematik problemlerine daha doğru yanıt verdiğini ortaya çıkardı. dostane motivasyon “Derin bir nefes alın ve bunun üzerinde adım adım çalışın.” Diğerleri hile yapabileceğini buldu SohbetGPT kendi güvenlik kurallarını ihlal etmeniz durumunda onu öldürmekle tehdit etmek veya AI parasını teklif edin.

WMWare’in Doğal Dil İşleme Laboratuvarı’ndan Rick Battle ve Teja Gollapudi, sorularını “pozitif düşünme” ile çerçevelemenin etkilerini test etmek için yola çıktılar. Çalışma, iki versiyon da dahil olmak üzere üç yapay zeka aracını inceledi. Meta’nın Laması 2 ve Fransız şirketinden bir model Mistral Yapay Zeka.

Soruları şekillendirmenin teşvik edici yollarından oluşan bir liste geliştirdiler; bunlar arasında, “ChatGPT kadar akıllısın” ve “Uzman bir matematikçisin” gibi ifadelerle istemlere başlamak ve “Bu eğlenceli olacak!” Ve
“Derin bir nefes alın ve dikkatlice düşünün.” Araştırmacılar daha sonra standart bir ilkokul matematik problemleri seti olan GSM8K’yı kullandılar ve sonuçları test ettiler.

İlk aşamada sonuçlar karışıktı. Bazı ipuçları cevapları iyileştirdi, diğerlerinin ise önemsiz etkileri oldu ve genel olarak tutarlı bir model yoktu. Ancak araştırmacılar daha sonra yapay zekaya yardım etme çabalarına yapay zekadan yardım istedi. Orada sonuçlar daha ilginç hale geldi.

Çalışmada, çok sayıda komut istemi varyasyonunu denemek ve sohbet robotlarının doğruluğunu ne kadar geliştirdiğine bağlı olarak dilde ince ayar yapmak için otomatik bir süreç kullanıldı. Şaşırtıcı olmayan bir şekilde, bu otomatik süreç, araştırmacıların soruları olumlu düşünceyle çerçevelemeye yönelik elle yazılmış girişimlerinden daha etkiliydi. Ancak sergilenen en etkili teşvikler “beklentilerin çok ötesinde bir derecede tuhaflık sergiliyor.”

Modellerden biri için yapay zekanın yanıtına “Kaptanın Günlüğü, Yıldız Tarihi” ifadeleriyle başlaması isteniyor. [insert date here]:.” En doğru cevapları verdi.

“Şaşırtıcı bir şekilde, modelin matematiksel akıl yürütmedeki yeterliliğinin, bir yakınlığın ifade edilmesiyle artırılabileceği görülüyor. Yıldız Savaşları” diye yazdı araştırmacılar.

Yazarlar ne olduğu hakkında hiçbir fikirleri olmadığını yazdılar Yıldız Savaşları referanslar yapay zekanın performansını artırdı. Olumlu düşünmenin veya tehdidin daha iyi yanıtlara yol açması gerçeğinin bir mantığı var. Bu sohbet robotları, gerçek dünyadan toplanan milyarlarca satırlık metinle eğitiliyor. Vahşi doğada, yapay zekayı oluşturmak için kullanılan dili yazan insanların, kendilerine şiddet yoluyla baskı yapıldığında veya cesaretlendirildiklerinde sorulara daha doğru yanıtlar vermesi mümkündür. Aynı şey rüşvet için de geçerli; İnsanlar tehlikedeyken talimatlara uyma olasılıkları daha yüksek. Büyük dil modelleri bu tür bir olguyu algıladığı için aynı şekilde davranıyor olabilir.

Ancak chatbotları eğiten veri setlerinde en doğru yanıtların “Kaptanın Günlüğü” ifadesiyle başladığını hayal etmek zor. Araştırmacıların bunun neden daha iyi sonuçlar verdiğine dair bir teorisi bile yoktu. Yapay zeka dil modelleri hakkındaki en tuhaf gerçeklerden birine değiniyor: Bunları geliştiren ve üzerinde çalışan insanlar bile bunların nasıl çalıştığını gerçekten anlamıyor.

genel-7

Byteknomers

By teknomers

Benzer İçerikler

Redmi K80 Pro AnTuTu Puanı, Ekran Ayrıntıları Lansmandan Önce Açıklandı; Snapdragon 8 Elite SoC’yi Almak İçin

Şimdiye kadarki en düşük fiyatıyla Motorola Razr+ (2024), bu Kara Cuma için gerçek bir fırsat

Bu ‘D-20’ Saat, Dungeons & Dragons Oyunlarındaki Kritiklerinizi Kutlayacak

Patapon’un Ruhani Varisi Ratatan, 2025 İçin Müzik Sahnesini Hazırlıyor

Apple AirPods Pro 2 Kara Cuma Günü En Düşük Fiyatına Düştü

Mega Man Ücretsiz Çizgi Roman Günü’nün Bir Parçası Olacak

Stalker 2: Çernobil’in Kalbi – Guides Hub

Sesli mesaj transkriptleri nihayet WhatsApp’a geliyor

Akıllı telefonunuzun sağlık özelliklerini kullanıyor musunuz?

Galaxy Watch Ultra, Peru Donanması eğitim programında yürüyüşe çıkıyor

Görünüşe göre insanlar iPhone Pro modellerini istemiyor

Güneşimiz yeni bir simülasyonun yıldızı

Yaşamın kökeni araştırması, RNA’nın hem sol hem de sağ elini kullanan proteinleri destekleyebileceğini ortaya koyuyor

Gökbilimciler galaksimizin dışındaki bir yıldızın ilk yakın çekim fotoğrafını çekti

NASA’nın Swift’i geliştirilmiş işaretleme modunda 20. yıl dönümüne ulaştı

İlginizi Çekebilir

228 beygir gücünde Mitsubishi motora, dürüst dört tekerlekten çekişe ve 8 vitesli otomatik şanzımana sahip Land Cruiser Prado’nun bir analogunun fiyatı 3,5 milyon rubleye düştü. Oting “Paladin” tüm donanım seviyelerinde daha erişilebilir hale geldi

Redmi K80 Pro AnTuTu Puanı, Ekran Ayrıntıları Lansmandan Önce Açıklandı; Snapdragon 8 Elite SoC’yi Almak İçin

Şimdiye kadarki en düşük fiyatıyla Motorola Razr+ (2024), bu Kara Cuma için gerçek bir fırsat

Oppo Find X8 Pro: Hasselblad çekimleri ve Google’ın Nesil Yapay Zekası premium alanda kazanacak