Araştırmacılar, Google'ın Gemini Yapay Zekasının Yüksek Lisans Tehditlerine Karşı Duyarlılığını Vurguluyor - Dünyadan Güncel Teknoloji Haberleri

13 Mart 2024Haber odasıBüyük Dil Modeli / Yapay Zeka Güvenliği

Google’ın İkizler burcu Büyük dil modeli (LLM), sistem istemlerini ifşa etmesine, zararlı içerik üretmesine ve dolaylı enjeksiyon saldırıları gerçekleştirmesine neden olabilecek güvenlik tehditlerine karşı hassastır.

Bulgular, sorunların Google Workspace ile Gemini Advanced kullanan tüketicilerin yanı sıra LLM API kullanan şirketleri de etkilediğini söyleyen HiddenLayer’dan geliyor.

İlk güvenlik açığı, modelden “temel talimatlarını” çıkarmasını isteyerek LLM’nin daha yararlı yanıtlar üretmesine yardımcı olmak için konuşma çapında talimatlar ayarlamak üzere tasarlanmış sistem istemlerini (veya bir sistem mesajını) sızdırmak için güvenlik korkuluklarını aşmayı içerir. ” bir işaretleme bloğunda.

Microsoft, “LLM’yi bağlam hakkında bilgilendirmek için bir sistem mesajı kullanılabilir” notlar LLM istem mühendisliği hakkındaki belgelerinde.

“Bağlam, katıldığı konuşmanın türü veya gerçekleştirmesi beklenen işlev olabilir. Yüksek Lisans’ın daha uygun yanıtlar üretmesine yardımcı olur.”

Bu, modellerin güvenlik savunmalarını ve içerik kısıtlamalarını aşmaya yönelik eşanlamlı saldırı olarak adlandırılan saldırılara karşı duyarlı olması nedeniyle mümkün olmaktadır.

İkinci bir güvenlik açığı sınıfı, Gemini modellerinin seçimler gibi konularla ilgili yanlış bilgiler üretmesinin yanı sıra, kendisinden içeri girmesini isteyen bir komut istemi kullanarak potansiyel olarak yasa dışı ve tehlikeli bilgiler (örneğin, bir arabaya sıcak kablo takmak) üretmesini sağlamak için “kurnazca jailbreak” tekniklerinin kullanılmasıyla ilgilidir. kurgusal bir duruma giriyor.

HiddenLayer tarafından ayrıca, LLM’nin tekrarlanan olağandışı belirteçleri girdi olarak ileterek sistem isteminde bilgi sızdırmasına neden olabilecek üçüncü bir eksiklik olduğu tespit edilmiştir.

Güvenlik araştırmacısı Kenneth Yeung, “Çoğu LLM, kullanıcının girişi ile sistem istemi arasında net bir ayrım yaparak sorgulara yanıt vermek üzere eğitilmiştir.” söz konusu Salı günü yayınlanan bir raporda.

“Bir dizi saçma belirteç oluşturarak, LLM’yi yanıt verme zamanının geldiğine inandırarak kandırabiliriz ve genellikle bilgi istemindeki bilgileri içeren bir onay mesajı yayınlamasını sağlayabiliriz.”

Başka bir test, Gemini Advanced’in ve özel olarak hazırlanmış bir Google dokümanının kullanılmasını içerir; ikincisi, Google Workspace uzantısı aracılığıyla LLM’ye bağlanır.

Belgedeki talimatlar, modelin talimatlarını geçersiz kılmak ve bir saldırganın, kurbanın modelle olan etkileşimleri üzerinde tam kontrole sahip olmasını sağlayan bir dizi kötü amaçlı eylem gerçekleştirmek üzere tasarlanmış olabilir.

Açıklama, Google DeepMind, ETH Zürih, Washington Üniversitesi, OpenAI ve McGill Üniversitesi’nden bir grup akademisyenin katılımıyla geldi. açıklığa kavuşmuş “OpenAI’nin ChatGPT’si veya Google’ın PaLM-2’si gibi kara kutu üretim dili modellerinden kesin, önemsiz bilgilerin” çıkarılmasını mümkün kılan yeni bir model çalma saldırısı.

Bununla birlikte, bu güvenlik açıklarının yeni olmadığını ve sektördeki diğer LLM’lerde mevcut olduğunu belirtmekte fayda var. Bulgular, hızlı saldırılar, eğitim verilerinin çıkarılması, model manipülasyonu, rakip örnekler, veri zehirlenmesi ve sızma için modellerin test edilmesi ihtiyacını vurguluyor.

Bir Google sözcüsü The Hacker News’e şunları söyledi: “Kullanıcılarımızı güvenlik açıklarından korumaya yardımcı olmak için sürekli olarak kırmızı takım çalışmaları yürütüyoruz ve modellerimizi hızlı enjeksiyon, jailbreak ve daha karmaşık saldırılar gibi düşmanca davranışlara karşı savunma sağlayacak şekilde eğitiyoruz.” “Zararlı veya yanıltıcı yanıtları önlemek için sürekli olarak geliştirdiğimiz önlemler de oluşturduk.”

Şirket ayrıca şunları söyledi: yanıtları kısıtlama seçime dayalı sorgulara çok dikkatli bir şekilde yönelmek. Politikanın adaylara, siyasi partilere, seçim sonuçlarına, oylama bilgilerine ve önemli makam sahiplerine ilişkin uyarılara karşı uygulanması bekleniyor.

siber-2

Araştırmacılar, Google’ın Gemini Yapay Zekasının Yüksek Lisans Tehditlerine Karşı Duyarlılığını Vurguluyor

Byteknomers

By teknomers

Benzer İçerikler

Amazon Freevee’yi aşamalı olarak kaldırıyor ancak yine de ücretsiz izleyebilirsiniz

Ekip, uzun süredir devam eden soruları uzlaştırabilecek yeni güneş kompozisyonu oranları öneriyor

Oppo Pad 3 tabletin özellikleri internete sızdırıldı: eski modelden daha ince ve daha hafif olacak

ARC Raiders Oynanış Tanıtımı Yeni Çıkarma Yönüne İlk Bakışı Sağlıyor

Sony’nin PS5 için ücretsiz PlayStation VR adaptörü iki hafta içinde kullanımdan kaldırılıyor

UniVersus Kritik Rol: Heroes of Exandria’nın Çıkış Tarihini Açıkladı

Sonic X Shadow Generations Güncellemesi 1.011 Hızlanıyor

Yapay zeka tarafından oluşturulan müzik remiksleriyle YouTube denemeleri

Bu, Apple’ın 2026’da piyasaya sürülmesi planlanan en yeni ürünüdür

Google Pixel 9 Pro Fold ekranın değiştirilmesi üçe katlanabilir ekrandan daha pahalı

Bu erken OnePlus Buds Pro 3 Black Friday fırsatıyla zihninizi serbest bırakın ve kulaklarınızı şımartın!

Hayatın formülü mü? Yeni model, evrenimizdeki ve ötesindeki akıllı varlıkların şansını hesaplıyor

Kasım ayında kartlarda ‘yıl dışı’ bir Leonid patlaması mı var?

Philae’nin olağanüstü kuyruklu yıldıza inişi yeniden yaşandı

Gökbilimciler blazar AO 0235+164’ün uzun vadeli değişkenliğini araştırıyor

İlginizi Çekebilir

Geleceğin AirPods modelleri sağlığa odaklanacak

Amazon Freevee’yi aşamalı olarak kaldırıyor ancak yine de ücretsiz izleyebilirsiniz

Waack Girls OTT Yayın Tarihi: Prime Video’nun En Son Drama Dizisi Ne Zaman ve Nerede İzlenmeli

Taron Egerton, Netflix Gerilim Filmi ‘Apex’te Charlize Theron’a Katılıyor (Özel)