Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Bilim adamları yapay zeka için görünmez bir tehdit ortaya koydular: Darkmad Saldırısı AI’nın muhakemesini manipüle ediyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Bilim adamları yapay zeka için görünmez bir tehdit ortaya koydular: Darkmad Saldırısı AI’nın muhakemesini manipüle ediyor

Genel

Bilim adamları yapay zeka için görünmez bir tehdit ortaya koydular: Darkmad Saldırısı AI’nın muhakemesini manipüle ediyor

teknomers
Son güncelleme: 18 Şubat 2025 21:17
teknomers
Paylaş
Paylaş


Louis Üniversitesi’nden bilim adamları, Darkmad adlı yapay zekanın dil modellerine yeni bir gizli saldırı geliştirdiler. Bu saldırı, bu tür modelleri kullanan sistemlerin güvenliği için ciddi sonuçlara yol açabilecek AI akıl yürütme sürecini algılanamaz bir şekilde manipüle edebilir.

Çalışmanın yazarları olan Zen Go ve Turani Reza, chatpt de dahil olmak üzere birçok modern dil modeli tarafından kompleksi çözmek için kullanılan “akıl yürütme zincirleri” (zinciri, haddesi, karyola) paradigmasında kırılganlığı buldular. Sorunlar. Darkmad, bu güvenlik açığını çalıştırır ve dil modellerine dayalı özelleştiricilere “gizli tetikleyiciler” getirir.


İllüstrasyon: Dall-e sinir ağı

Darkmad saldırısının tuhaflığı, modelin olağan kullanımı ile göze çarpmaması ve belirli akıl yürütme şablonları ile etkinleştirilmesidir. Bu, standart koruma yöntemlerini tespit etmeyi son derece zorlaştırır.

Araştırmacılar, GPT-4 ve LLAMA-3 gibi en modern modeller de dahil olmak üzere çeşitli dil modellerine karşı Darkmad’ın yüksek verimliliğini gösteren testler yaptılar. Daha iyi akıl yürütme yeteneklerine sahip daha gelişmiş modellerin bu saldırıya karşı daha savunmasız olması dikkat çekicidir.

Git ve Turani, Dark -Fromind’in çeşitli akıl yürütme alanlarına uygulanabileceğini belirtiyor. Dahası, böyle bir saldırı yaratmak, dil modelleri alanında derin bilgi gerektirmez, bu da yaygın olma riskini artırır.

Bankacılık ve sağlık hizmetleri de dahil olmak üzere çeşitli alanlarda dil modellerinin artan kullanımı göz önüne alındığında, Darkmad tipine yönelik saldırılar güvenlik için ciddi bir tehdittir. Karar verme sürecini belirgin bir müdahale belirtisi olmadan manipüle edebilirler.

Araştırmacılar, çalışmalarının modern dil modellerinin güvenliğinde kritik bir boşluk ortaya çıkardığını vurgulamaktadır. Bu sorunun incelenmesine devam etmeyi ve akıl yürütmenin tutarlılığının doğrulanması ve düşmanca tetikleyicilerin tespiti gibi yeni koruma mekanizmaları geliştirmeyi planlıyorlar.

GO ve Turani’nin çalışması, yapay zekanın güvenliği üzerine bir çalışmada yeni bir yön açar ve dil modellerine dayalı sistemlerin güvenilirliğini ve güvenliğini sağlamak için daha mükemmel koruma önlemleri geliştirme ihtiyacını vurgular.



genel-22

Bu hafta sonu Netflix, Disney Plus ve Hulu’da izlenecek 9 yeni film ve şov (23-25 ​​Eylül)
FIFA 23 Simgeler listesi ve sızıntılar
Japon RTX 50 perakendeci piyango yakıtlı kargaşa için özür diliyor-asi kalabalık yaralanmalara neden oldu, yakındaki anaokuluna zarar veriyor
Wordle bugün: 28 Ocak (#588) için yanıt ve ipuçları
Stormgate, Geri Alma Net Kodu Alan İlk RTS Oyunu Olabilir
ETİKETLENDİ:adamlarıAInınbilgi GüvenliğiBilimBirChatGPTDarkmaddil modelleriediyorGörünmeziçinKaranlıkkoydularMakine eğitimimanipülemuhakemesiniortayasaldırısısiber güvenlikTehditYapayyapay zekaZeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Yeni araştırmalar bunun uzaydaki dalgalanmalarla olabileceğini buluyor
Sonraki Makale NASA astronotları Sunita Williams ve Butch Wilmore, Mart ayında geri dönmeye hazırlanan ‘Streed’ iddialarını işten çıkarın

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Şaman İçin Versatile ve Korkutucu Yeni Silah Kartı Tanıtımı
Oyun
Kan Mesajı’nın Yakın Dövüş Savaş Mekaniği Tanıtımdan Daha Etkileyici
Oyun
Harici API’leri Koruma: Laravel’de Redis Token Bucket Kullanımı
Yazılım
PC Oyun Gösterimi’nden Favori Sekiz Oyun Seçkisi
Oyun
Apple geniş kapsamlı sesli yazım özelliğini tanıttı
Genel
WWDC 2026: Siri’den iOS 27’ye, Neler Bekleniyor?
Yapay Zeka
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?