Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Antropik, AI modellerinden zararlı içeriği engellemek için yeni çerçeve açıklıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Antropik, AI modellerinden zararlı içeriği engellemek için yeni çerçeve açıklıyor

Liste

Antropik, AI modellerinden zararlı içeriği engellemek için yeni çerçeve açıklıyor

teknomers
Son güncelleme: 5 Şubat 2025 11:48
teknomers
Paylaş
Paylaş

Antropic, “Yeni makalemizde, modelleri jailbreaklere karşı koruyan anayasal sınıflandırıcılara dayanan bir sistemi tanımlıyoruz” dedi. “Bu anayasal sınıflandırıcılar, minimum aşırı gerilemelerle ve büyük bir hesaplama yüküne sahip olmadan jailbreaklerin ezici çoğunluğunu filtreleyen sentetik olarak üretilen veriler üzerinde eğitilmiş girdi ve çıktı sınıflandırıcılarıdır.”

Anayasa sınıflandırıcıları, daha önce Claude’u hizalamak için kullanılan bir teknik olan anayasal yapay zekaya benzer bir sürece dayanıyor. Her iki yöntem de bir anayasaya dayanır – modelin takip etmek için tasarlandığı bir dizi ilke.

Şirket, “Anayasal sınıflandırıcılar söz konusu olduğunda, ilkeler izin verilen ve izin verilmeyen içerik sınıflarını tanımlar (örneğin hardal tariflerine izin verilir, ancak hardal gazı tarifleri yoktur)” diye ekledi şirket.

Bu ilerleme, kuruluşların veri ihlalleri, düzenleyici uyumsuzluk ve AI tarafından üretilen zararlı içerikten kaynaklanan itibar hasarı gibi AI ile ilgili riskleri azaltmasına yardımcı olabilir.

Diğer teknoloji şirketleri de benzer adımlar attı, Microsoft geçen yıl Mart ayında “istekli kalkanlar” özelliğini tanıttı ve Meta, Temmuz 2024’te hızlı bir bekçi modelini açtı.

Gelişen güvenlik paradigmaları

Yapay zeka benimsemesi endüstriler arasında hızlandıkça, güvenlik paradigmaları ortaya çıkan tehditleri ele almak için gelişmektedir.



genel-13

AB, ‘Vahşi Batı’ Kripto Piyasaları için Kural Kitabı’nı Kabul Etti: Yeni Kurallar Nelerdir ve Gelecekte Nasıl Etkilenecek?
Across the Spider-Verse’deki En İyi ve En Kötü Örümcek Kahramanlar, Sıralamalı
Bu hafta sonu alışveriş için 7 Mart Madness TV fırsatları – QLED’ler 318 dolardan başlayan fiyatlarla
Bütçe dostu Moto G Stylus 5G 2022, bu fırsattan yararlanırsanız fiyatından 150 $ indirimle sizin olabilir
Starliner mürettebatsız olarak Dünya’ya dönecek, astronotlar Şubat ayına kadar ISS’de kalacak
ETİKETLENDİ:AçıklıyorantropikÇerçeveEngellemekiçeriğiiçinmodellerindenYenizararlı
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Meta’s CTO iddiaları 2025, Metaverse’in geleceğini tanımlayacak ve platform çekiş kazanamazsa, bunun ‘efsanevi bir yanlış macera’ olacağını söylüyor
Sonraki Makale Koreli Perakende RTX 5090 Çin’de Satılık Benekli – Çinli Müşteriler Japonya ve Tayvan’ı da yağmalayın

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Yaz Oyun Festivali 2026’da Göz Kamaştıran Trailera Şahit Olun
Oyun
Apple’ın WWDC 2026 Anahtarı: İzleme Yöntemleri ve Beklentiler
Genel
Tanrıların İntikamı: God of War Laufey’de Sürpriz Karakterler Bekleniyor
Oyun
JMGO N3 Ultimate projektör, yeni taşınabilir 4K şampiyonu mu?
Liste
Laravel AI SDK ile ReAct Sohbet Ajanı Geliştirme
Yazılım
Final Fantasy Revelasyonu: Definitif Son Ama Yan Hikayelere Kapı Aralıyor
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?