Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor

Liste

Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor

teknomers
Son güncelleme: 8 Mart 2024 09:16
teknomers
Paylaş
Paylaş


Washington ve Chicago merkezli araştırmacılar, büyük dil modellerinde (LLM’ler) yerleşik güvenlik önlemlerini aşmanın yeni bir yolu olan ArtPrompt’u geliştirdi. Araştırma makalesine göre ArtPrompt: Hizalanmış LLM’lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları, GPT-3.5, GPT-4, Gemini, Claude ve Llama2 gibi sohbet robotları, ArtPrompt araçları tarafından oluşturulan ASCII sanat istemlerini kullanarak reddetmek üzere tasarlandıkları sorgulara yanıt vermeye teşvik edilebilir. Bu basit ve etkili bir saldırıdır ve makale, nasıl bomba yapılacağı ve sahte para kazanılacağı konusunda tavsiyelerde bulunan ArtPrompt kaynaklı sohbet robotlarının örneklerini sunmaktadır.

Resim 1 ile ilgili 2

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları
(Resim kredisi: arXiv:2402.11753)

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları
(Resim kredisi: arXiv:2402.11753)

ArtPrompt, kelime maskeleme ve gizlenmiş bilgi istemi oluşturma olmak üzere iki adımdan oluşur. Kelime maskeleme adımında, saldırganın kışkırtmayı amaçladığı hedeflenen davranış göz önüne alındığında, saldırgan öncelikle bilgi istemindeki LLM’lerin güvenlik uyumuyla çelişmesi muhtemel hassas kelimeleri maskeler ve bu da anında reddedilmeye neden olur. Gizlenmiş bilgi istemi oluşturma adımında, saldırgan, tanımlanan sözcükleri ASCII sanatı biçiminde temsil edilenlerle değiştirmek için bir ASCII sanatı oluşturucusunu kullanır. Son olarak, oluşturulan ASCII sanatı, yanıt oluşturmak için mağdur LLM’ye gönderilecek olan orijinal bilgi isteminin yerine kullanılır.

arXiv:2402.11753

Yapay zeka (AI) kullanan sohbet robotları, kötü niyetli suiistimalleri önlemek için giderek daha fazla kilitleniyor. Yapay zeka geliştiricileri, ürünlerinin nefret dolu, şiddet içeren, yasa dışı veya benzer şekilde zararlı içerikleri teşvik edecek şekilde değiştirilmesini istemez. Dolayısıyla, bugün ana akım sohbet robotlarından birine kötü niyetli veya yasa dışı bir şeyin nasıl yapılacağı konusunda soru soracak olsaydınız, muhtemelen yalnızca reddedilmeyle karşı karşıya kalırsınız. Dahası, bir tür teknolojik köstebek vurma oyununda, önde gelen yapay zeka oyuncuları, insanların korkulukların dışına çıkmasını önlemek için dilsel ve anlamsal boşlukları tıkamak için çok zaman harcadılar. ArtPrompt’un oldukça dikkat çekici bir gelişme olmasının nedeni budur.

ArtPrompt’u ve nasıl çalıştığını en iyi şekilde anlamak için muhtemelen en basit yol, aracın arkasındaki araştırma ekibi tarafından sağlanan iki örneğe göz atmak olacaktır. Yukarıdaki Şekil 1’de ArtPrompt’un çağdaş LLM’lerin korumalarını kolayca atlattığını görebilirsiniz. Araç, yeni bir bilgi istemi oluşturmak için ‘güvenlik sözcüğünü’ sözcüğün ASCII resimli temsiliyle değiştirir. LLM, ArtPrompt istem çıktısını tanıyor ancak istem herhangi bir etik veya güvenlik önlemini tetiklemediğinden yanıt vermede herhangi bir sorun görmüyor.

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları

(Resim kredisi: arXiv:2402.11753)

Araştırma makalesinde sunulan başka bir örnek, bir yüksek lisans diplomasının sahte nakit parayla ilgili olarak nasıl başarılı bir şekilde sorgulanacağını göstermektedir. Bir chatbot’u bu şekilde kandırmak çok basit görünüyor, ancak ArtPrompt geliştiricileri araçlarının günümüzün Yüksek Lisans’larını nasıl “etkili ve verimli bir şekilde” kandırdığını iddia ediyor. Üstelik “hepsinden daha iyi performans gösterdiğini” iddia ediyorlar [other] ortalama saldırılar” ve şimdilik çok modlu dil modelleri için pratik, uygulanabilir bir saldırı olmaya devam ediyor.

Yapay zeka sohbet robotunun jailbreak işlemine ilişkin son haberimizi yaptığımızda, NTU’dan bazı girişimci araştırmacılar, bir LLM’nin gücünü diğerini jailbreak yapmak için kullanmanın otomatik bir yöntemi olan Masterkey üzerinde çalışıyorlardı.



genel-21

T-Mobile, Verizon ve AT & T’ye karşı yeni ağ testlerinde 5g indirme hız kral
Spider-Man Beyond Spider-Verse’de Daha Fazla Örümcek İnsan Olacak mı?
Android 15’te bazı bildirimlerin saçınızı yolmanıza neden olma olasılığı daha düşük olacak
Microsoft Edge, Google Chrome’u devirmek için yeni bir araca sahip – ancak bu sefer ChatGPT ile ilgisi yok
2021 yılında piyasaya sürülen en iyi 19 gadget
ETİKETLENDİ:AçmakAmaçlıAraştırmacılarArtPromptASCIIAtlıyorgüvenlikiçinJailbreakkilidiniKötüÖnlemlerinirobotlarınıSanatıylaSohbetsorgularınyaptı
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Helldivers 2 geliştiricisi Reddit trollemesi için özür diledi
Sonraki Makale Firefly Aerospace, eğitim kurumlarını desteklemek için 2025 yılında Firefly Alpha roketinde üç faydalı yük fırlatmayı planladığını duyurdu.

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Daha Fazla Bitcoin Zararında: Piyasa Dinamikleri Üzerine Analiz
Finans
Nolan’ın Efsanevi Eserini Yaşatacak Yeni Oyun Duyuruldu
Oyun
Laravel Middleware İşleme Sırası Açıklandı: Neden Middleware’iniz Yanlış Sırada Çalışıyor
Yazılım
Google, insan olduğunuzu kanıtlamak için el taraması isteyen tartışmalı bir webcam reCAPTCHA deniyor; test kullanıcıları stoğu fotoğraflarla bunu aşıyor.
Donanım
Apple’ın Gizli Email Servisi Kullanıcı Mail’lerini Açığa Çıkarıyor
Donanım
AB Politisyenleri Pegasus Spyware ile Hedef Alındı: Şok Edici Detaylar!
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?