Yeni Antropik Araştırma Yapay Zekanın 'Kara Kutusuna' Işık Tutuyor - Dünyadan Güncel Teknoloji Haberleri

İnsanlar tarafından yaratılmış olmalarına rağmen büyük dil modelleri hala oldukça gizemlidir. Mevcut yapay zeka patlamamıza güç veren yüksek oktanlı algoritmalar, onları gözlemleyen insanlara dışarıdan açıklanamayacak şeyler yapma yöntemine sahip. Bu nedenle yapay zeka büyük ölçüde “kara kutu” olarak adlandırılan dışarıdan kolayca anlaşılamayan bir olgu.

Beğenin veya Beğenmeyin, Doktorunuz Yapay Zekayı Kullanacak | AI Kilidi Açıldı

Yapay zeka sektörünün en iyi şirketlerinden biri olan Anthropic’in yeni yayınlanan araştırması, yapay zekanın algoritmik davranışının daha kafa karıştırıcı yönlerine ışık tutmaya çalışıyor. Salı günü Anthropic bir yayınladı Araştırma kağıdı AI sohbet robotu Claude’un neden belirli konular hakkında içerik üretmeyi diğerlerine tercih ettiğini açıklamak için tasarlandı.

Yapay zeka sistemleri kuruldu İnsan beyninin kabaca bir tahminiyle; bilgiyi alıp işleyen ve daha sonra bu bilgiye dayanarak “kararlar” veya tahminler yapan katmanlı sinir ağları. Bu tür sistemler, algoritmik bağlantılar kurmalarına olanak tanıyan büyük veri alt kümeleri üzerinde “eğitimlidir”. Ancak yapay zeka sistemleri, eğitimlerine dayalı olarak veri çıkışı sağladığında insan gözlemciler, algoritmanın bu çıktıya nasıl ulaştığını her zaman bilemez.

Bu gizem, alanın ortaya çıkmasına neden oldu. Yapay zeka “yorumuAraştırmacıların, çıktısını anlayabilmeleri için makinenin karar verme yolunu izlemeye çalıştıkları yer. Yapay zeka yorumlama alanında bir “özellik”, etkinleştirilen bir deseni ifade eder. “nöronlar” bir sinir ağı içinde – etkili bir şekilde algoritmanın referans alabileceği bir kavram. Araştırmacılar bir sinir ağında ne kadar çok “özellik” anlayabilirlerse, belirli girdilerin ağı belirli çıktıları etkilemek için nasıl tetiklediğini de o kadar iyi anlayabilirler.

İçinde Bir not Antropik araştırmacılar, bulgularına dayanarak, Claude’un sinir ağının hangi bölümlerinin belirli kavramlarla eşleştirildiğini çözmek için “sözlük öğrenme” olarak bilinen bir süreci nasıl kullandıklarını açıklıyorlar. Araştırmacılar, bu yöntemi kullanarak “hangi özelliklerin belirli bir girdiye yanıt verdiğini görerek model davranışını anlamaya başlayabildiklerini, böylece modelin belirli bir yanıta nasıl ulaştığına ilişkin ‘akıl yürütmesi’ hakkında bize fikir verebildiklerini” söylüyorlar.

Anthropic’in araştırma ekibiyle yapılan bir röportajda Wired’dan Steven Levy tarafından, personel Claude’un “beyninin” nasıl çalıştığını çözmenin nasıl bir şey olduğunu açıkladı. Bir özelliğin şifresini nasıl çözeceklerini öğrendikten sonra bu, diğerlerine de yol açtı:

Dikkatlerini çeken bir özellik de Golden Gate Köprüsü ile ilgiliydi. Birlikte ateşlendiklerinde Claude’un San Francisco’yu Marin County’ye bağlayan devasa yapı hakkında “düşündüğünü” gösteren nöron setinin haritasını çıkardılar. Dahası, benzer nöron grupları harekete geçtiğinde, Golden Gate Köprüsü yakınındaki konuları çağrıştırdılar: Alcatraz, Kaliforniya Valisi Gavin Newsom ve Hitchcock filmi. Baş dönmesiSan Francisco’da kuruldu. Hepsi ekibe milyonlarca özelliğin tanımlandığını söyledi; Claude’un sinir ağını çözecek bir çeşit Rosetta Taşı.

Diğer kar amacı güden şirketler gibi Anthropic’in de araştırmasını bu şekilde yazmak ve yayınlamak için işle ilgili belirli motivasyonlara sahip olabileceği unutulmamalıdır. Bununla birlikte, takımın kağıt halka açıktırBu, gidip kendiniz okuyabileceğiniz ve bulguları ve metodolojileri hakkında kendi sonuçlarınızı çıkarabileceğiniz anlamına gelir.

genel-7

Yeni Antropik Araştırma Yapay Zekanın ‘Kara Kutusuna’ Işık Tutuyor

Byteknomers

By teknomers

Benzer İçerikler

Pil canavarı Moto G Power 5G (2024), Amazon’da 100 $ indirimle sıcak bir seçim olmaya devam ediyor

Akıl sağlığınızdan ödün vermeden bir startup kurabilir misiniz? Bonobo’nun kurucusu Andy Dunn öyle düşünüyor

Yenilmez Dövüş Kızı serileştirilmiş animasyon hayalini canlı tutmak istiyor

Keanu Reeves, Sonic 3 Filmindeki Shadow The Hedgehog Performansıyla Övgü Aldı

Hades tarzı Kral Arthur roguelike Sworn’un artık ücretsiz bir demosu var, ancak bu uzun sürmeyecek

Metafor: ReFantazio Güncellemesi 1.09 Nihayet PS4, Xbox One ve PC’de Yayınlandı

Capcom, Monster Hunter Wilds lansmanının betada gelişeceğini garanti ediyor

Bu, Samsung’un 2025’teki amiral gemisi serisinin tamamı olabilir

Düşük verimlere rağmen Samsung, Galaxy S25 ve S25+ modellerini Exynos 2500 AP ile paketlemeyi tercih ediyor

Huawei’nin kurucusu ve CEO’su bir kez daha ABD’li teknoloji devlerini övdü

Sıcak Bose SoundLink Max nihayet Amazon’da satışa çıkıyor – fırsatınız varken bir tanesinde 100 $ tasarruf edin

Uluslararası SWOT uydusu gezegeni kasıp kavuran Grönland tsunamisini tespit ediyor

Dünyanın kutupları ters döndüğünde böyle ses çıkıyor

Kara delik çalışması Kerr’in çözüm varsayımlarına meydan okuyor

Hubble ve Webb, Vega’nın etrafındaki şaşırtıcı derecede pürüzsüz diski araştırıyor

İlginizi Çekebilir

Ubisoft, Assassin’s Creed Shadows’un “anlatıyı değiştirme” şansını geciktirdiğini söylüyor

Pil canavarı Moto G Power 5G (2024), Amazon’da 100 $ indirimle sıcak bir seçim olmaya devam ediyor

Akıl sağlığınızdan ödün vermeden bir startup kurabilir misiniz? Bonobo’nun kurucusu Andy Dunn öyle düşünüyor

Resmi bayi yeni bir Honda Accord getirdi ve onu 3 yıl garantiyle satıyor. Ama fiyat etkileyici