Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor

Liste

Araştırmacılar, ASCII sanatıyla AI sohbet robotlarını jailbreak yaptı – ArtPrompt, kötü amaçlı sorguların kilidini açmak için güvenlik önlemlerini atlıyor

teknomers
Son güncelleme: 8 Mart 2024 09:16
teknomers
Paylaş
Paylaş


Washington ve Chicago merkezli araştırmacılar, büyük dil modellerinde (LLM’ler) yerleşik güvenlik önlemlerini aşmanın yeni bir yolu olan ArtPrompt’u geliştirdi. Araştırma makalesine göre ArtPrompt: Hizalanmış LLM’lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları, GPT-3.5, GPT-4, Gemini, Claude ve Llama2 gibi sohbet robotları, ArtPrompt araçları tarafından oluşturulan ASCII sanat istemlerini kullanarak reddetmek üzere tasarlandıkları sorgulara yanıt vermeye teşvik edilebilir. Bu basit ve etkili bir saldırıdır ve makale, nasıl bomba yapılacağı ve sahte para kazanılacağı konusunda tavsiyelerde bulunan ArtPrompt kaynaklı sohbet robotlarının örneklerini sunmaktadır.

Resim 1 ile ilgili 2

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları
(Resim kredisi: arXiv:2402.11753)

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları
(Resim kredisi: arXiv:2402.11753)

ArtPrompt, kelime maskeleme ve gizlenmiş bilgi istemi oluşturma olmak üzere iki adımdan oluşur. Kelime maskeleme adımında, saldırganın kışkırtmayı amaçladığı hedeflenen davranış göz önüne alındığında, saldırgan öncelikle bilgi istemindeki LLM’lerin güvenlik uyumuyla çelişmesi muhtemel hassas kelimeleri maskeler ve bu da anında reddedilmeye neden olur. Gizlenmiş bilgi istemi oluşturma adımında, saldırgan, tanımlanan sözcükleri ASCII sanatı biçiminde temsil edilenlerle değiştirmek için bir ASCII sanatı oluşturucusunu kullanır. Son olarak, oluşturulan ASCII sanatı, yanıt oluşturmak için mağdur LLM’ye gönderilecek olan orijinal bilgi isteminin yerine kullanılır.

arXiv:2402.11753

Yapay zeka (AI) kullanan sohbet robotları, kötü niyetli suiistimalleri önlemek için giderek daha fazla kilitleniyor. Yapay zeka geliştiricileri, ürünlerinin nefret dolu, şiddet içeren, yasa dışı veya benzer şekilde zararlı içerikleri teşvik edecek şekilde değiştirilmesini istemez. Dolayısıyla, bugün ana akım sohbet robotlarından birine kötü niyetli veya yasa dışı bir şeyin nasıl yapılacağı konusunda soru soracak olsaydınız, muhtemelen yalnızca reddedilmeyle karşı karşıya kalırsınız. Dahası, bir tür teknolojik köstebek vurma oyununda, önde gelen yapay zeka oyuncuları, insanların korkulukların dışına çıkmasını önlemek için dilsel ve anlamsal boşlukları tıkamak için çok zaman harcadılar. ArtPrompt’un oldukça dikkat çekici bir gelişme olmasının nedeni budur.

ArtPrompt’u ve nasıl çalıştığını en iyi şekilde anlamak için muhtemelen en basit yol, aracın arkasındaki araştırma ekibi tarafından sağlanan iki örneğe göz atmak olacaktır. Yukarıdaki Şekil 1’de ArtPrompt’un çağdaş LLM’lerin korumalarını kolayca atlattığını görebilirsiniz. Araç, yeni bir bilgi istemi oluşturmak için ‘güvenlik sözcüğünü’ sözcüğün ASCII resimli temsiliyle değiştirir. LLM, ArtPrompt istem çıktısını tanıyor ancak istem herhangi bir etik veya güvenlik önlemini tetiklemediğinden yanıt vermede herhangi bir sorun görmüyor.

ArtPrompt: Hizalanmış LLM'lere Yönelik ASCII Sanat Tabanlı Jailbreak Saldırıları

(Resim kredisi: arXiv:2402.11753)

Araştırma makalesinde sunulan başka bir örnek, bir yüksek lisans diplomasının sahte nakit parayla ilgili olarak nasıl başarılı bir şekilde sorgulanacağını göstermektedir. Bir chatbot’u bu şekilde kandırmak çok basit görünüyor, ancak ArtPrompt geliştiricileri araçlarının günümüzün Yüksek Lisans’larını nasıl “etkili ve verimli bir şekilde” kandırdığını iddia ediyor. Üstelik “hepsinden daha iyi performans gösterdiğini” iddia ediyorlar [other] ortalama saldırılar” ve şimdilik çok modlu dil modelleri için pratik, uygulanabilir bir saldırı olmaya devam ediyor.

Yapay zeka sohbet robotunun jailbreak işlemine ilişkin son haberimizi yaptığımızda, NTU’dan bazı girişimci araştırmacılar, bir LLM’nin gücünü diğerini jailbreak yapmak için kullanmanın otomatik bir yöntemi olan Masterkey üzerinde çalışıyorlardı.



genel-21

GoPro’nun yeni fiyatları, sadık aboneler dışında herkes için iyi haber
İşte Kaliforniya’nın 9 (ve sayısı artan) yeni yapay zeka yasası kapsamında yasadışı olanlar
iPhone 16 Pro Modellerinin iPhone 15 Serisine Göre Daha Büyük Pillere Sahip Olduğu Bildirildi
Deliveroo tarihinde ilk kez net kâra ulaştı
Çin, Elon Musk’tan Starlink’i ülke içinde satmamasını istedi
ETİKETLENDİ:AçmakAmaçlıAraştırmacılarArtPromptASCIIAtlıyorgüvenlikiçinJailbreakkilidiniKötüÖnlemlerinirobotlarınıSanatıylaSohbetsorgularınyaptı
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Helldivers 2 geliştiricisi Reddit trollemesi için özür diledi
Sonraki Makale Firefly Aerospace, eğitim kurumlarını desteklemek için 2025 yılında Firefly Alpha roketinde üç faydalı yük fırlatmayı planladığını duyurdu.

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Lucid Motors’ta Üst Düzey İsimler Değişiyor
Genel
Yeni Kahraman Cyberpunk Temalı Bir Şeytan Olacak
Oyun
Acil: Claude Fable 5 Sınırlı Süreyle Kullanıma Sunuldu!
Siber Güvenlik
2026 Yılında Geçerli Kriptopara Kurtarma Şirketi: Viste_ZEUS KRİPTO KURTARMA HİZMETLERİ
Yazılım
Justin Ernest’in geleneksel VC olmadan 500M$ yatırımı nasıl yaptı?
Yapay Zeka
Google AI Abonelik Fiyat Savaşlarında Uyarı Verdi
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?