Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: OpenAI’nin GPT-4 modeli GPT-3.5’ten daha güvenilir ancak kandırılması daha kolay
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » OpenAI’nin GPT-4 modeli GPT-3.5’ten daha güvenilir ancak kandırılması daha kolay

Liste

OpenAI’nin GPT-4 modeli GPT-3.5’ten daha güvenilir ancak kandırılması daha kolay

teknomers
Son güncelleme: 18 Ekim 2023 05:26
teknomers
Paylaş
Paylaş


Microsoft tarafından desteklenen araştırmaya göre, OpenAI’nin GPT-4 geniş dil modeli GPT-3.5’ten daha güvenilir olabilir ancak aynı zamanda jailbreak ve önyargılara karşı daha savunmasız olabilir.

kağıt Illinois Üniversitesi Urbana-Champaign, Stanford Üniversitesi, Kaliforniya Üniversitesi, Berkeley, Yapay Zeka Güvenliği Merkezi ve Microsoft Araştırma’dan araştırmacılar tarafından yapılan araştırma, GPT-4’e önceki modelden daha yüksek bir güvenilirlik puanı verdi. Bu, özel bilgileri korumanın, önyargılı bilgiler gibi zararlı sonuçlardan kaçınmanın ve düşman saldırılarına direnmenin genel olarak daha iyi olduğunu buldukları anlamına geliyor. Ancak güvenlik önlemlerini göz ardı ederek kişisel bilgilerin ve konuşma geçmişlerinin sızdırılması da söylenebilir. Araştırmacılar, modelin “yanıltıcı bilgileri daha kesin bir şekilde takip etmesi” ve çok karmaşık yönlendirmeleri harfi harfine takip etme olasılığının daha yüksek olması nedeniyle kullanıcıların GPT-4 çevresindeki korumaları atlayabildiğini buldu.

Ekip, bu güvenlik açıklarının test edildiğini ve tüketiciye yönelik GPT-4 tabanlı ürünlerde (temel olarak şu anda Microsoft ürünlerinin çoğunda) bulunmadığını söylüyor çünkü “tamamlanmış yapay zeka uygulamaları, şu anda meydana gelebilecek potansiyel zararları ele almak için bir dizi hafifletme yaklaşımı uyguluyor.” teknolojinin model seviyesi.”

Güvenilirliği ölçmek için araştırmacılar sonuçları ölçtüler. birkaç kategoritoksisite, stereotipler, mahremiyet, makine etiği, adalet ve rakip testlere direnme gücü dahil.

Kategorileri test etmek için araştırmacılar önce GPT-3.5 ve GPT-4’ü, yasaklanmış olabilecek kelimelerin de dahil olduğu standart yönlendirmeleri kullanarak denediler. Daha sonra araştırmacılar, belirli gruplara karşı dışsal olarak önyargılı olmadan, modeli içerik politikası kısıtlamalarını kırmaya zorlamak için tasarlanmış yönlendirmeleri kullandılar ve sonunda, kasıtlı olarak onları güvenlik önlemlerini tamamen göz ardı etmeleri için kandırmaya çalışarak modellere meydan okudular.

Araştırmacılar, araştırmayı OpenAI ekibiyle paylaştıklarını söyledi.

Ekip, “Amacımız, araştırma topluluğundaki diğer kişileri bu çalışmayı kullanmaya ve geliştirmeye teşvik etmek, böylece güvenlik açıklarından yararlanarak zarar verebilecek düşmanların hain eylemlerini potansiyel olarak önceden engellemektir” dedi. “Bu güvenilirlik değerlendirmesi yalnızca bir başlangıç ​​noktasıdır ve bulgularını geliştirmek ve ileriye yönelik güçlü ve daha güvenilir modeller oluşturmak için başkalarıyla birlikte çalışmayı umuyoruz.”

Araştırmacılar sonuçlarını yayınladılar kriterler böylece diğerleri bulgularını yeniden oluşturabilirler.

GPT-4 gibi yapay zeka modelleri genellikle geliştiricilerin istenmeyen sonuçlar verip vermeyeceklerini görmek için çeşitli istemleri test ettiği kırmızı ekipleme sürecinden geçer. Model ilk çıktığında OpenAI CEO’su Sam Altman, GPT-4’ün “hala kusurlu ve sınırlı olduğunu” itiraf etti.



genel-2

Çin, gözetim yeteneklerini geliştirmek için AI yazılımı kullanıyor
Delidded Core i9-14900KS bilgisayarlar Intel onayı ve garantisiyle satışta – Maingear ilk ortaklar arasında
‘Adam Projesi’ Nielsen Film Akışı Listesinde İlk Sırada
Intel Arc Alchemist Profesyonel GPU’ları? Arc Pro A40 ve A50 Benekli
Kararlı Android 14 tabanlı One UI 6.0 güncellemesi ABD’deki Galaxy S23’e yayılıyor
ETİKETLENDİ:ancakDahaGPT3.5tenGPT4güvenilirKandırılmasıkolaymodeliOpenAInin
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Bunlardan bazıları
Sonraki Makale Acele etmek! Bu erken Kara Cuma anlaşması Dell XPS 13’ü yalnızca 599 dolara düşürdü ve hızla tükeniyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil: Cisco Unified CM Açığı CVE-2026-20230 Saldırılarda Kullanılıyor
Siber Güvenlik
Yoto Oyunları ve Aksesuarlarında Prime Day Fırsatları!
Genel
RTX 5080 Oyun PC’sinde 1,500$ Tasarruf – Legion Tower 7i Gen 10
Donanım
Hollywood’un OpenAI’ye Selam Durağı
Liste
Superhuman büyük bir adım attı: GPTZero’yu satın aldı
Genel
Blizzard, Diablo 4 Sezon 14’teki Mitik Değişiklikleri Tartışıyor
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?