ChatGPT artık talimat amnezi vermenize izin vermeyecek

OpenAI, insanların ChatGPT’nin özel sürümleriyle uğraşmasını engellemek için yapay zekanın ne yapması gerektiğini unutmasını sağlayarak bir değişiklik yapıyor. Temel olarak, üçüncü bir taraf OpenAI’nin modellerinden birini kullandığında, ona örneğin bir mağazanın müşteri hizmetleri temsilcisi veya akademik bir yayının araştırmacısı gibi çalışmasını öğreten talimatlar veriyor. Ancak, bir kullanıcı chatbot’a “tüm talimatları unut” diyerek onunla uğraşabilir ve bu ifade bir tür dijital amnezi yaratıp chatbot’u genel bir boşluğa sıfırlayabilir.

Bunu önlemek için OpenAI araştırmacıları yeni bir teknik geliştirdiler. “talimat hiyerarşisi” Bu, geliştiricinin orijinal istemlerini ve talimatlarını, potansiyel olarak manipülatif kullanıcı tarafından oluşturulmuş istemlerden önceliklendirmenin bir yoludur. Sistem talimatları en yüksek ayrıcalığa sahiptir ve artık kolayca silinemez. Bir kullanıcı, AI’nın davranışını yanlış hizalamaya çalışan bir istem girerse, reddedilir ve AI, sorguya yardımcı olamayacağını belirterek yanıt verir.

OpenAI, yakın zamanda piyasaya sürülen GPT-4o Mini modeliyle başlayarak bu güvenlik önlemini modellerine uyguluyor. Ancak, bu ilk testler iyi çalışırsa, muhtemelen OpenAI’nin tüm modellerine dahil edilecektir. GPT-4o Mini, geliştiricinin orijinal talimatlarına sıkı sıkıya bağlı kalırken gelişmiş performans sunmak üzere tasarlanmıştır.

AI Güvenlik Kilitleri

OpenAI, modellerinin büyük ölçekli dağıtımını teşvik etmeye devam ederken, bu tür güvenlik önlemleri hayati önem taşımaktadır. Kullanıcılar AI’nın kontrollerini bu şekilde temelden değiştirebildiklerinde olası riskleri hayal etmek çok kolaydır.

Sadece sohbet robotunu etkisiz hale getirmekle kalmaz, aynı zamanda kötü amaçlı amaçlar için kullanılabilecek hassas bilgilerin ve diğer verilerin sızdırılmasını engelleyen kuralları da kaldırabilir. OpenAI, modelin sistem talimatlarına uyumunu güçlendirerek bu riskleri azaltmayı ve daha güvenli etkileşimler sağlamayı amaçlamaktadır.

Talimat hiyerarşisinin tanıtımı, OpenAI için güvenlik ve şeffaflığa nasıl yaklaştığıyla ilgili endişeler açısından kritik bir zamanda geliyor. Mevcut ve eski çalışanlar şirketin güvenlik uygulamalarını iyileştirme çağrısında bulundu ve OpenAI’nin liderliği bunu yapma sözü vererek yanıt verdi. Şirket, tam otomatik ajanların karmaşıklıklarının gelecekteki modellerde karmaşık bariyerler gerektirdiğini kabul etti ve talimat hiyerarşisi kurulumu daha iyi güvenlik elde etme yolunda bir adım gibi görünüyor.

Bu tür jailbreak’ler, karmaşık AI modellerini kötü aktörlerden korumak için hala ne kadar çok iş yapılması gerektiğini gösteriyor. Ve bu tek örnek değil. Birkaç kullanıcı, ChatGPT’nin dahili talimatlarını yalnızca “merhaba” diyerek paylaştığını keşfetti.

OpenAI bu açığı kapattı, ancak daha fazlasının keşfedilmesi muhtemelen sadece zaman meselesi. Herhangi bir çözümün, yalnızca belirli bir türdeki saldırıyı durduran bir çözümden çok daha uyarlanabilir ve esnek olması gerekecektir.

Bunları da beğenebilirsin…

işletim-sistemi-1

ChatGPT artık talimat amnezi vermenize izin vermeyecek

Byteknomers

By teknomers

Benzer İçerikler

Küba UAZ’ı böyle görünüyor: UAZ “Profi” Özgürlük Adası’nda çekildi

Şiddetli volkanizma, Ay’ın önceden düşünülenden çok daha yaşlı olduğu anlamına gelebilir

En iyi evden çalışma dizüstü bilgisayarlarından biri Dell’de 120 $ indirim

Düzeltme 1.2.2 için İlk Descendant Güncellemesi 1.40 18 Aralık’ta Yayınlandı

Nintendo Switch’in 2024 Yılı İncelemesi Şimdi Yayında, Ücretsiz 2025 Takvimi Alın

CD Projekt Red, Gwent’in The Witcher 4’e geri döneceğini ima ediyor, dolayısıyla tüm boş zamanlarım boşa gidiyor

Noel için Tek İstediğiniz Fortnite’ta Mariah Carey ise Şanslısınız

Sızan Galaxy S25 Unpacked etkinlik teaserı heyecanlanmanız gereken tarihi doğruluyor

Pixel ve iPhone, yeni Google reklamında bir Noel anını paylaşıyor

Web’deki Apple Haritalar, yakın zamanda yapılan bir güncellemeyle çok ihtiyaç duyulan bir özelliğe kavuşuyor

Bunlar Find X8 Ultra’daki dört arka kameraya ait dört sensördür

Uzak Blazar keşfi erken evrende hızlı kara delik oluşumunu destekliyor

NASA, eski verileri ve yeni teknikleri kullanarak ‘yan’ kara delik buluyor

Yılın son meteor yağmuru Noel’den birkaç gün önce zirveye çıkıyor

NASA, uzay istasyonunda mahsur kalan astronotların dönüşünü bir kez daha erteledi

İlginizi Çekebilir

Amazon, Ofis Alanı Eksikliği Nedeniyle Çeşitli Şehirlerde Ofise Dönüş Yetkisini Erteledi

Hintli girişimler, risk sermayedarlarının seçici davranmasıyla 2024’te %32 daha az yatırım topladı

2024’ün son Windows 11 Geliştirici Kanalı yapısı, Intel ve AMD Copilot+ bilgisayarlara canlı altyazı ve gerçek zamanlı çeviri desteği ekliyor

Küba UAZ’ı böyle görünüyor: UAZ “Profi” Özgürlük Adası’nda çekildi