İnsanlar tarafından yaratılmış olmalarına rağmen büyük dil modelleri hala oldukça gizemlidir. Mevcut yapay zeka patlamamıza güç veren yüksek oktanlı algoritmalar, onları gözlemleyen insanlara dışarıdan açıklanamayacak şeyler yapma yöntemine sahip. Bu nedenle yapay zeka büyük ölçüde “kara kutu” olarak adlandırılan dışarıdan kolayca anlaşılamayan bir olgu.

Yapay zeka sektörünün en iyi şirketlerinden biri olan Anthropic’in yeni yayınlanan araştırması, yapay zekanın algoritmik davranışının daha kafa karıştırıcı yönlerine ışık tutmaya çalışıyor. Salı günü Anthropic bir yayınladı Araştırma kağıdı AI sohbet robotu Claude’un neden belirli konular hakkında içerik üretmeyi diğerlerine tercih ettiğini açıklamak için tasarlandı.

Yapay zeka sistemleri kuruldu İnsan beyninin kabaca bir tahminiyle; bilgiyi alıp işleyen ve daha sonra bu bilgiye dayanarak “kararlar” veya tahminler yapan katmanlı sinir ağları. Bu tür sistemler, algoritmik bağlantılar kurmalarına olanak tanıyan büyük veri alt kümeleri üzerinde “eğitimlidir”. Ancak yapay zeka sistemleri, eğitimlerine dayalı olarak veri çıkışı sağladığında insan gözlemciler, algoritmanın bu çıktıya nasıl ulaştığını her zaman bilemez.

Bu gizem, alanın ortaya çıkmasına neden oldu. Yapay zeka “yorumuAraştırmacıların, çıktısını anlayabilmeleri için makinenin karar verme yolunu izlemeye çalıştıkları yer. Yapay zeka yorumlama alanında bir “özellik”, etkinleştirilen bir deseni ifade eder. “nöronlar” bir sinir ağı içinde – etkili bir şekilde algoritmanın referans alabileceği bir kavram. Araştırmacılar bir sinir ağında ne kadar çok “özellik” anlayabilirlerse, belirli girdilerin ağı belirli çıktıları etkilemek için nasıl tetiklediğini de o kadar iyi anlayabilirler.

İçinde Bir not Antropik araştırmacılar, bulgularına dayanarak, Claude’un sinir ağının hangi bölümlerinin belirli kavramlarla eşleştirildiğini çözmek için “sözlük öğrenme” olarak bilinen bir süreci nasıl kullandıklarını açıklıyorlar. Araştırmacılar, bu yöntemi kullanarak “hangi özelliklerin belirli bir girdiye yanıt verdiğini görerek model davranışını anlamaya başlayabildiklerini, böylece modelin belirli bir yanıta nasıl ulaştığına ilişkin ‘akıl yürütmesi’ hakkında bize fikir verebildiklerini” söylüyorlar.

Anthropic’in araştırma ekibiyle yapılan bir röportajda Wired’dan Steven Levy tarafından, personel Claude’un “beyninin” nasıl çalıştığını çözmenin nasıl bir şey olduğunu açıkladı. Bir özelliğin şifresini nasıl çözeceklerini öğrendikten sonra bu, diğerlerine de yol açtı:

Dikkatlerini çeken bir özellik de Golden Gate Köprüsü ile ilgiliydi. Birlikte ateşlendiklerinde Claude’un San Francisco’yu Marin County’ye bağlayan devasa yapı hakkında “düşündüğünü” gösteren nöron setinin haritasını çıkardılar. Dahası, benzer nöron grupları harekete geçtiğinde, Golden Gate Köprüsü yakınındaki konuları çağrıştırdılar: Alcatraz, Kaliforniya Valisi Gavin Newsom ve Hitchcock filmi. Baş dönmesiSan Francisco’da kuruldu. Hepsi ekibe milyonlarca özelliğin tanımlandığını söyledi; Claude’un sinir ağını çözecek bir çeşit Rosetta Taşı.

Diğer kar amacı güden şirketler gibi Anthropic’in de araştırmasını bu şekilde yazmak ve yayınlamak için işle ilgili belirli motivasyonlara sahip olabileceği unutulmamalıdır. Bununla birlikte, takımın kağıt halka açıktırBu, gidip kendiniz okuyabileceğiniz ve bulguları ve metodolojileri hakkında kendi sonuçlarınızı çıkarabileceğiniz anlamına gelir.



genel-7