Üretken AI modelleri aslında insan benzeri değildir. Zekaları veya kişilikleri yoktur — bunlar yalnızca bir cümledeki en olası sonraki kelimeleri tahmin eden istatistiksel sistemlerdir. Ancak zalim bir işyerindeki stajyerler gibi, Yapmak Şikayet etmeden talimatları takip edin – modellerin temel niteliklerini ve ne yapıp ne yapmamaları gerektiğini gösteren ilk “sistem uyarıları” dahil.

OpenAI’dan Anthropic’e kadar her üretken AI satıcısı, modellerin kötü davranmasını önlemek (ya da en azından önlemeye çalışmak) ve modellerin yanıtlarının genel tonunu ve duygusunu yönlendirmek için sistem istemlerini kullanır. Örneğin, modele nazik olması gerektiğini ancak asla özür dilememesi gerektiğini söyleyebilir.

Ancak satıcılar genellikle sistem istemlerini gizli tutarlar — muhtemelen rekabet nedenleriyle, ama belki de sistem istemini bilmenin onu aşmanın yollarını gösterebilmesi nedeniyle. Örneğin, GPT-4o’nun sistem istemini açığa çıkarmanın tek yolu bir istem enjeksiyon saldırısıdır. (Ve o zaman bile, sistemin çıktısına tamamen güvenilemez.)

Ancak Anthropic, kendisini daha etik ve şeffaf bir yapay zeka tedarikçisi olarak gösterme çabalarında, yayınlandı Sistem, en son modellerini (Claude 3.5 Opus, Sonnet ve Haiku) Claude iOS ve Android uygulamalarında ve web üzerinde soruyor.

Anthropic’in geliştirici ilişkileri başkanı Alex Albert, X’te yaptığı paylaşımda, Anthropic’in sistem uyarılarını güncelleyip ince ayar yaptıkça bu tür açıklamaları düzenli hale getirmeyi planladığını söyledi.

12 Temmuz tarihli son istemler, Claude’un yapamayacağı şeyleri çok açık bir şekilde açıklıyor; örneğin, “Claude URL’leri, bağlantıları veya videoları açamaz.” Yüz tanıma kesinlikle yasaktır; Claude 3.5 Opus’un sistem istemi, modele “her zaman tamamen yüz körüymüş gibi yanıt ver” ve “herhangi bir insanı tanımlamaktan veya isimlendirmekten kaçın” diyor. [images].”

Ancak istemler aynı zamanda belirli kişilik özelliklerini ve karakteristiklerini de tanımlıyor; bunlar Anthropic’in modellerin örneklendirmesini istediği özellikler ve karakteristikler.

Örneğin Opus’un istemi, Claude’un “çok zeki ve entelektüel açıdan meraklı” gibi görünmesi ve “insanların bir konu hakkında ne düşündüğünü duymaktan ve çok çeşitli konularda tartışmaya girmekten hoşlandığı”nı söyler. Ayrıca Claude’a tartışmalı konuları tarafsızlık ve nesnellikle ele alması, “dikkatli düşünceler” ve “net bilgiler” sağlaması ve asla bir cevaba “elbette” kelimesiyle başlamaması talimatını verir.

Bu insan için her şey biraz garip: Bir tiyatro oyunundaki aktörün yazabileceği gibi yazılmış olan bu sistem komutları karakter analiz sayfasıOpus’un istemi “Claude şu anda bir insanla bağlantı kuruyor” cümlesiyle bitiyor; bu da Claude’un ekranın diğer ucundaki bir tür bilinç olduğu ve tek amacının insan sohbet arkadaşlarının kaprislerini yerine getirmek olduğu izlenimini veriyor.

Ama tabii ki bu bir yanılsama. Claude’un istemleri bize bir şey söylüyorsa, o da insan rehberliği ve el tutma olmadan bu modellerin korkutucu derecede boş levhalar olduğudur.





genel-24