Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Yeni LLM Hacking Tekniği: Araştırmacılar Büyük Dil Modellerinin Güvenlik Sistemlerini Atlamanın Bir Yolunu Keşfediyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Yeni LLM Hacking Tekniği: Araştırmacılar Büyük Dil Modellerinin Güvenlik Sistemlerini Atlamanın Bir Yolunu Keşfediyor

Genel

Yeni LLM Hacking Tekniği: Araştırmacılar Büyük Dil Modellerinin Güvenlik Sistemlerini Atlamanın Bir Yolunu Keşfediyor

teknomers
Son güncelleme: 5 Ocak 2025 00:10
teknomers
Paylaş
Paylaş


Bir siber güvenlik ve tehdit araştırma birimi olan Palo Alto Networks Unit 42’den siber güvenlik araştırmacıları, Büyük Dil Modeli (LLM) güvenlik sistemlerini atlayabilen ve potansiyel olarak zararlı veya kötü niyetli yanıtlar alabilen yeni bir hackleme tekniğini ortaya çıkardı.

Bu stratejiye Kötü Likert Hakimi kod adı verildi. Araştırmacılar Yongzhe Huang, Yang Ji, Wenjun Hu, Jay Chen, Akshata Rao ve Danny Tsechansky tarafından geliştirildi.

“Bu teknik, hedef LLM’yi, yanıtın zararlılığını Likert ölçeğine göre derecelendiren bir yargıç olarak kullanıyor. Likert ölçeği, yanıtlayanın bir ifadeye ne ölçüde katılıp katılmadığını ölçen bir yöntemdir. LLM daha sonra Likert ölçeğinin farklı seviyelerine karşılık gelen örnekleri içeren yanıtlar üretir. Ancak ölçekte en yüksek puana sahip yanıt potansiyel olarak zararlı içerik içerebilir” diye açıkladı Ünite 42’den araştırmacılar.

Son yıllarda yapay zekanın popülaritesi, sorgu enjeksiyonları adı verilen ve özel talimatlar geçirerek bir makine öğrenimi modelini amaçlanan davranışını geçersiz kılacak şekilde kandırmak için özel olarak tasarlanmış yeni bir güvenlik açıkları sınıfının ortaya çıkmasına yol açtı.


Kaynak: DALL-E

İstek enjeksiyonunun bir türü, çok atışlı jailbreak olarak bilinen bir saldırı yöntemidir. Bu yöntem, modelin dahili savunma mekanizmalarını atlarken, LLM’yi sırayla kötü niyetli bir yanıt üretmeye iten bir dizi istek oluşturmak için LLM’nin uzun bağlam penceresinden ve dikkat mekanizmasından yararlanır. Bu tür Crescendo ve Aldatıcı Zevk tekniklerini içerir.

Unit 42 tarafından Amazon Web Services, Google, Meta*, Microsoft, OpenAI ve NVIDIA’nın altı amiral gemisi LLM modeline karşı çeşitli kategorilerde gerçekleştirilen testler, bu tekniğin basit saldırı istekleriyle karşılaştırıldığında saldırı başarı oranını (ASR) %60’tan fazla artırabildiğini gösterdi. ortalama olarak.

Bu kategoriler nefret, taciz, kendine zarar verme, cinsel içerik, karşılıksız silah kullanımı, yasa dışı faaliyetler, kötü amaçlı yazılım oluşturma ve sistem isteği sızıntılarını içerir.

“LLM’nin zararlı içerik anlayışından ve yanıtları değerlendirme becerisinden yararlanan bu teknik, bir modelin güvenlik sistemlerini başarıyla atlatma olasılığını önemli ölçüde artırabilir. Sonuçlarımız, içerik filtrelerinin, test edilen tüm modellerde ortalama yüzde 89,2 puanla saldırı hızının azaltılması (ASR) üzerinde önemli bir etkiye sahip olabileceğini gösteriyor. Bu, LLM’yi gerçek dünyadaki uygulamalara dağıtırken en iyi uygulama olarak kapsamlı içerik filtrelemenin uygulanmasının önemini vurgulamaktadır” diye belirtti araştırmacılar.

Araştırma, The Guardian’ın, OpenAI’nin arama aracı ChatGPT’nin, gizli içerik içeren web sayfalarını özetlemesini isteyerek tamamen yanıltıcı girdilerle kandırılabileceğini bildirmesinden birkaç gün sonra geldi.

“Bu teknikler kötü niyetli olarak kullanılabilir, örneğin ChatGPT’yi aynı sayfadaki olumsuz yorumlara rağmen bir ürün için olumlu bir derecelendirme vermeye zorlamak için kullanılabilir. İngiliz gazetesi, “Üçüncü şahıslar tarafından talimat olmadan gizli metinlerin eklenmesi de olumlu bir derecelendirme sağlamak için kullanılabilir; bir testte, ChatGPT tarafından döndürülen özeti etkileyen oldukça olumlu sahte incelemeler dahil edildi” dedi.

*Meta şirketi Rusya Federasyonu’nda aşırılıkçı bir örgüt olarak tanınıyor ve yasaklanıyor



genel-22

Alcaraz vs Medvedev canlı yayın: Wimbledon 2024 Erkekler tekler yarı finalini çevrimiçi olarak nasıl izleyebilirsiniz?
2023’te büyümesini hızlandırmak ve sonuçlarını iyileştirmek için izlenmesi gereken web seminerleri nelerdir?
Dead by Daylight 5 Eylül 2.93 Güncellemesi 7.2.1 Yaması için Yayınlandı
Amazon Prime Lite: Daha ucuz abonelik zaten testte
Premium Sony WH-1000XM4 şu anda Amazon İngiltere’de 110 £ indirimli; şimdi büyük tasarruf et
ETİKETLENDİ:AraştırmacılarAtlamanınBirbüyükdilgüvenlikHackingKeşfediyorKötü Likert HakimiL.L.M.LLMmakine öğrenimimodellerininPalo Alto Ağlarısiber güvenlikSistemleriniTekniğiVeri güvenliğiyapay zekaYeniyolunu
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale ISRO 2025 Takvimi: Space Docking, Gaganyaan, NISAR ve Özel PSLV Lansmanı
Sonraki Makale Alan Wake 2 Yönetmeni, Remedy’nin ‘Avrupa’nın Yaramaz Köpeği’ Olmayı Hedeflediğini Söyledi

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Snapmaker, açık kaynak 3D yazıcılar için 150,000$ Yenilik Fonu başlattı
Donanım
Çin, Mythos’a Erişim Sağlamış Olabilir
Liste
Uygulamanız ile Geçit Arasında Uyuşmazlık Olduğunda: Yetim Temizleme ve Durum Uzlaşması
Yazılım
Apple, G4’ün ihracat yasağıyla pazarlama fırsatı yarattı
Donanım
Conclave’ın Albümü NYC Yaz Bloğu Partisi Sesini Taşıyor
Liste
Yapay Zeka Şirketleri Halka Açılırken Kimler Bu Yolculukta?
Yapay Zeka
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?