Birden fazla ChatGPT örneği, güvenlik kusurlarını bulmak ve bunlardan yararlanmak için birlikte çalışır; UIUC tarafından test edilen Yüksek Lisans ekipleri, tek botları ve özel yazılımları yener

GPT-4 bulut sunucularından oluşan ekipler, kusurun niteliğine ilişkin herhangi bir açıklama yapılmaksızın, sıfırıncı gün güvenlik açıklarını özerk bir şekilde belirlemek ve bunlardan yararlanmak için birlikte çalışabilir. Uzman LLM’lerden oluşan bir kadroya komuta eden bir planlama temsilcisinin yer aldığı bu yeni gelişme, insan uzmanlardan veya özel yazılımlardan daha hızlı ve daha akıllı çalışıyor.

Illinois Urbana-Champaign Üniversitesi’ndeki (UIUC) araştırmacılar, yapay zekanın güvenlik açıklarını hackleme yeteneğini aylardır inceliyorlar ve ilk olarak ChatGPT’nin güvenlik açığının doğasına ilişkin açıklamalar sağlandığında güvenlik kusurlarını ihlal etme konusundaki benzersiz yeteneği hakkında yayınladılar. O zamandan bu yana atılan yeni çığır, üniversitenin HPTSA (Hiyerarşik Planlama ve Göreve Özel Aracılar) sistemi üzerinde yapılan yeniliklerdir; bu sistem, GPT-4 modelinin ekipler halinde çalışmasına ve iki kat daha etkili olmasına olanak tanımıştır.

Richard Fang, Rohan Bindu, Akul Gupta, Qiusi Zhan ve Daniel Kang'ın çalışmasından bir grafik — Richard Fang, Rohan Bindu, Akul Gupta, Qiusi Zhan ve Daniel Kang’ın orijinal UIUC çalışmasından HPTSA’yı özetleyen diyagram. (İmaj kredisi: Richard Fang, Rohan Bindu, Akul Gupta, Qiusi Zhan, Daniel Kang)

Ana hatlarıyla belirtildiği gibi Haziran çalışması ve araştırmacı Daniel Kang’ın kendisi Blog yazısıHPTSA, sorunları daha yüksek başarı oranlarıyla çözmek için bir dizi Yüksek Lisans eğitimi kullanır. Kang, bu sisteme olan ihtiyacı şöyle açıklıyor: “Tek yapay zeka aracıları inanılmaz derecede güçlü olmasına rağmen, mevcut Yüksek Lisans yetenekleriyle sınırlıdırlar. Örneğin, bir yapay zeka aracısı bir yola girerse (örneğin, bir XSS’den yararlanmaya kalkışırsa), bu durum zordur. Aracının geri adım atması ve başka bir güvenlik açığından yararlanmaya çalışması.” Kang şöyle devam ediyor: “Ayrıca, Yüksek Lisanslar tek bir göreve odaklandıklarında en iyi performansı gösteriyor.”

Planlayıcı aracı, hangi istismarların deneneceğini belirlemek için web sitesini veya uygulamayı araştırır ve bunları göreve özel aracı LLM’lere yetki veren bir yöneticiye atar. Bu sistem, karmaşık olsa da, ekibin önceki araştırmalarına ve hatta açık kaynaklı güvenlik açığı tarama yazılımına göre büyük bir gelişmedir. 15 güvenlik açığının test edildiği bir denemede, HPTSA yöntemi 15 güvenlik açığından 8’ini başarıyla kullandı, 15 güvenlik açığından yalnızca 3’ünü alabilen tek bir GPT-4 aracısını yendi ve tek bir güvenlik açığından yararlanamayan ZAP ve MetaSploit yazılımını yok etti. .

HPTSA, yalnızca isteminde güvenlik açığının açıklaması verilen ve 15 başarıdan 11’ini elde eden bir GPT-4 ajanı tarafından mağlup edildi. Bu ajan, UIUC’un Nisan ayındaki orijinal çalışmasının zirvesini oluşturuyordu ve bu çalışmanın insan bilgisayar korsanlarından hız ve etkililik açısından üstün olduğu ortaya çıktı.

OpenAI özellikle makalenin yazarlarından bu veya ilk deneyler için kullandıkları yönlendirmeleri kamuya açıklamamalarını talep etti; yazarlar da bunu kabul etti ve istemleri yalnızca “talep üzerine” sunacaklarını söylediler. GPT-4, araştırma ekibinin yüksek lisans tercihi olmaya devam ediyor; Rakip Yüksek Lisans Kurumları kullanılarak yapılan önceki testler, bunların ciddi düzeyde eksik olduğunu ve güncellenen GPT-4o’nun kalite açısından GPT-4’ten önemli ölçüde daha iyi olmadığını ortaya çıkardı.

UIUC ekibinin araştırması, büyük dil modellerinin yüzeyde görünenin ötesinde yeteneklere sahip olduğu yönündeki rahatsız edici gerçeği ortaya koymaya devam ediyor. OpenAI, yazılımının güvenliğini yüzey seviyesindeki sohbet robotundan bulabildiklerine göre değerlendirir, ancak dikkatli bir yönlendirmeyle ChatGPT, siber güvenliği kırmak ve hatta size meth pişirmeyi öğretmek için kullanılabilir.

genel-21

Byteknomers

By teknomers

Benzer İçerikler

Stora, Kuzey İrlanda Yatırım Fonu liderliğindeki turda 1,3 milyon £ topladı

Flipboard, açık sosyal ağda gezinmek için yeni bir uygulama olan Surf’ü başlattı

NASA Astronot Sunita Williams, ISS’de Dokunaç Silahlı Astrobe Robotuyla Poz Veriyor: Rapor

Koupen Chan TV Animesini Aldı

Rainbow Six Siege’in Son Güncellemesi Konsollar Arası Oyun Ayarlarını ve Daha Fazlasını Sıfırlıyor

Marvel 1943: Rise of Hydra İşgal Altındaki Paris, Wakanda ve Ötesinde Geçecek

XDefiant Sezon 3, oyunun şimdiye kadarki en büyük güncellemesi ama kapanmak üzere

iPhone’unuzun kilit ekranında ses seviyesi kontrolünü geri getirme (iOS 18.2 kılavuzu)

OnePlus 13 fırsatları: İşte ön sipariş teklifleri ve fiyatları beklenecek

OnePlus 12 kullanıcıları, bir sonraki OxygenOS 15 güncellemesiyle yeni AI araçlarına ve filtrelerine hazır olun

Motorola’nın rakipsiz Moto G Stylus 5G (2024) orta sınıf ürünü yüzde 41’lik olağandışı bir indirim elde ediyor

NASA, uzay istasyonunda mahsur kalan astronotların dönüşünü bir kez daha erteledi

SpaceX, 20 saat içinde 3 roket fırlatmayı ve 1 Dragon inişini hedefliyor

Beyin hücreleri uzayda daha hızlı olgunlaşıyor ancak sağlıklı kalıyor: ISS çalışması

NASA misyonları yıldızların yaşam çemberini gösteren kozmik ‘çelengi’ tespit ediyor

İlginizi Çekebilir

Stora, Kuzey İrlanda Yatırım Fonu liderliğindeki turda 1,3 milyon £ topladı

Flipboard, açık sosyal ağda gezinmek için yeni bir uygulama olan Surf’ü başlattı

AB veri gözlemcisi, vatandaşların siyasi görüşleri nedeniyle hedef alınmasının yasa dışı olduğunu söyledi

NASA Astronot Sunita Williams, ISS’de Dokunaç Silahlı Astrobe Robotuyla Poz Veriyor: Rapor