Eğer onu inşa edersen, insanlar onu kırmaya çalışacaklardır. Bazen insanlar bile bina onu bozan şeylerdir. Anthropic ve mevcut LLM teknolojisindeki ilginç bir güvenlik açığını ortaya koyan son araştırmasında da durum böyledir. Aşağı yukarı bir soruyu cevaplamaya devam ederseniz, korkulukları kırabilir ve büyük dil modellerinin size tasarlanmadıkları şeyleri söylemesiyle karşılaşabilirsiniz. Nasıl bomba yapılır gibi.
Elbette açık kaynak yapay zeka teknolojisindeki ilerleme göz önüne alındığında, kendi LLM’nizi yerel olarak başlatabilir ve ona ne isterseniz sorabilirsiniz, ancak daha tüketici düzeyindeki şeyler için bu, üzerinde düşünmeye değer bir konudur. Günümüzde yapay zekanın eğlenceli yanı, hızlı ilerlemesi ve tür olarak ne inşa ettiğimizi daha iyi anlamak için ne kadar iyi (ya da başarısız) olduğumuzdur.
Bu düşünceyi bana kabul ederseniz, LLM’ler ve diğer yeni yapay zeka model türleri daha akıllı ve daha büyük hale geldikçe Anthropic’in özetlediği türde daha fazla soru ve sorun görüp görmeyeceğimizi merak ediyorum. Bu belki de kendimi tekrar ediyorum. Ancak daha genelleştirilmiş yapay zeka zekasına yaklaştıkça, programlayabileceğimiz bir bilgisayara değil, düşünen bir varlığa daha çok benzemesi gerekir, değil mi? Eğer öyleyse, bu işin gerçekleştirilemez hale geldiği noktaya kadar uç vakaları tespit etmekte daha zorlanabilir miyiz? Neyse Anthropic’in son dönemde paylaştığı şeylerden bahsedelim.

