Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor

Liste

Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor

teknomers
Son güncelleme: 8 Mart 2024 09:16
teknomers
Paylaş
Paylaş


Washington ve Chicago merkezli araştırmacılar, büyük dil modellerinde (LLM’ler) yerleşik güvenlik önlemlerini aşmanın yeni bir yolu olan ArtPrompt’u geliştirdi. Araştırma makalesine göre ArtPrompt: Hizalanmış LLM’lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları, GPT-3.5, GPT-4, Gemini, Claude ve Llama2 gibi sohbet robotları, ArtPrompt araçları tarafından oluşturulan ASCII sanat istemlerini kullanarak reddetmek üzere tasarlandıkları sorgulara yanıt vermeye teşvik edilebilir. Bu basit ve etkili bir saldırıdır ve makale, nasıl bomba yapılacağı ve sahte para kazanılacağı konusunda tavsiyelerde bulunan ArtPrompt kaynaklı sohbet robotlarının örneklerini sunmaktadır.

Resim 1 ile ilgili 2

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları
(Resim kredisi: arXiv:2402.11753)

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları
(Resim kredisi: arXiv:2402.11753)

ArtPrompt, kelime maskeleme ve gizlenmiş bilgi istemi oluşturma olmak üzere iki adımdan oluşur. Kelime maskeleme adımında, saldırganın kışkırtmayı amaçladığı hedeflenen davranış göz önüne alındığında, saldırgan öncelikle bilgi istemindeki LLM’lerin güvenlik uyumuyla çelişmesi muhtemel hassas kelimeleri maskeler ve bu da anında reddedilmeye neden olur. Gizlenmiş bilgi istemi oluşturma adımında, saldırgan, tanımlanan sözcükleri ASCII sanatı biçiminde temsil edilenlerle değiştirmek için bir ASCII sanatı oluşturucusunu kullanır. Son olarak, oluşturulan ASCII sanatı, yanıt oluşturmak için mağdur LLM’ye gönderilecek olan orijinal bilgi isteminin yerine kullanılır.

arXiv:2402.11753

Yapay zeka (AI) kullanan sohbet robotları, kötü niyetli suiistimalleri önlemek için giderek daha fazla kilitleniyor. Yapay zeka geliştiricileri, ürünlerinin nefret dolu, şiddet içeren, yasa dışı veya benzer şekilde zararlı içerikleri teşvik edecek şekilde değiştirilmesini istemez. Dolayısıyla, bugün ana akım sohbet robotlarından birine kötü niyetli veya yasa dışı bir şeyin nasıl yapılacağı konusunda soru soracak olsaydınız, muhtemelen yalnızca reddedilmeyle karşı karşıya kalırsınız. Dahası, bir tür teknolojik köstebek vurma oyununda, önde gelen yapay zeka oyuncuları, insanların korkulukların dışına çıkmasını önlemek için dilsel ve anlamsal boşlukları tıkamak için çok zaman harcadılar. ArtPrompt’un oldukça dikkat çekici bir gelişme olmasının nedeni budur.

ArtPrompt’u ve nasıl çalıştığını en iyi şekilde anlamak için muhtemelen en basit yol, aracın arkasındaki araştırma ekibi tarafından sağlanan iki örneğe göz atmak olacaktır. Yukarıdaki Şekil 1’de ArtPrompt’un çağdaş LLM’lerin korumalarını kolayca atlattığını görebilirsiniz. Araç, yeni bir bilgi istemi oluşturmak için ‘güvenlik sözcüğünü’ sözcüğün ASCII resimli temsiliyle değiştirir. LLM, ArtPrompt istem çıktısını tanıyor ancak istem herhangi bir etik veya güvenlik önlemini tetiklemediğinden yanıt vermede herhangi bir sorun görmüyor.

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları

(Resim kredisi: arXiv:2402.11753)

Araştırma makalesinde sunulan başka bir örnek, bir yüksek lisans diplomasının sahte nakit parayla ilgili olarak nasıl başarılı bir şekilde sorgulanacağını göstermektedir. Bir chatbot’u bu şekilde kandırmak çok basit görünüyor, ancak ArtPrompt geliştiricileri araçlarının günümüzün Yüksek Lisans’larını nasıl “etkili ve verimli bir şekilde” kandırdığını iddia ediyor. Üstelik “hepsinden daha iyi performans gösterdiğini” iddia ediyorlar [other] ortalama saldırılar” ve şimdilik çok modlu dil modelleri için pratik, uygulanabilir bir saldırı olmaya devam ediyor.

Yapay zeka sohbet robotunun jailbreak işlemine ilişkin son haberimizi yaptığımızda, NTU’dan bazı girişimci araştırmacılar, bir LLM’nin gücünü diğerini jailbreak yapmak için kullanmanın otomatik bir yöntemi olan Masterkey üzerinde çalışıyorlardı.



genel-21

Corsair’in ultra hafif Katar Elite kablosuz oyun faresi 49 dolara düştü
Herkesin Hayal Ettiğinden Daha İyi Sonuç Veren En Şaşırtıcı 10 DC Filmi Oyuncu Seçimi
WhatsApp yakında kullanıcıların grup sohbetlerini filtrelemesine izin verebilir: Nasıl çalışacak?
Teksas’ta Keşfedilen Dinozor İzleri
ICICI Bank kredi veya banka kartınızı Tokenize Etme
ETİKETLENDİ:AçmakAmaçlıAraştırmacılarArtPromptASCIIAtlıyorgüvenlikiçinJailbreakkilidiniKötüÖnlemlerinirobotlarınıSanatıylaSohbetsorgularınyaptı
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Helldivers 2 geliştiricisi Reddit trollemesi için özür diledi
Sonraki Makale Firefly Aerospace, eğitim kurumlarını desteklemek için 2025 yılında Firefly Alpha roketinde üç faydalı yük fırlatmayı planladığını duyurdu.

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil: Anthropic, En Güçlü Yapay Zeka Claude Fable 5’i Tanıttı!
Siber Güvenlik
Xenoblade Tutkunlarına 2027 İçin Yeni Oyun Müjdesi
Oyun
Acil: ServiceNow Açıklarıyla Müşteri Hesaplarına Yetkisiz Erişim!
Siber Güvenlik
Sahte Webhook’ları Durdurun: Laravel’de HMAC İmzalarını Ustalaşın 🛡️
Yazılım
Meta, Hindistan’da Reliance ile İlk AI Veri Merkezi Anlaşmasını İmzaladı
Genel
Logitech’in Yeni Mobi Fold Fark Yaratan Boyutuyla Özellik Sunuyor
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?