OpenAI'nin yeni yönetim kurulu güvenlik kararlarını tersine çevirebilir - Dünyadan Güncel Teknoloji Haberleri

OpenAI’nin yeni yönetim kurulu güvenlik kararlarını tersine çevirebilir

Sam Altman’ın OpenAI CEO’su olarak yeniden işe alınmasından birkaç gün sonra yeni bir yönetim kurulunun oluşturulacağı açıklandı. Yaklaşık üç hafta sonra 18 Aralık Pazartesi günü şirket, yönetim kurulunun güvenlik kararlarını tersine çevirmesine izin vermek de dahil olmak üzere en gelişmiş modellerinde güvenliği ele alan bir çerçeve hazırladı.

Bu, çokça rapor edilen Project Q* gibi, insanlık için potansiyel olarak zararlı görülebilecek herhangi bir modelin, kurulun veto yetkisiyle rafa kaldırılabileceği anlamına geliyor.

Şirket, “Yapay zeka güvenliği sorunlarını çözmek için yapay zekanın kendisini kullanarak ve sorun kategorileri için genel çözümler oluşturarak, yapay zeka güvenliğine ilk prensiplerden yaklaşmamız gerekiyor” dedi.

Microsoft destekli şirket, en son teknolojisini yalnızca siber güvenlik ve nükleer tehditler gibi belirli alanlarda güvenli görülmesi durumunda kullanacağını söyledi.

OpenAI’nin Güvenlik Sistemleri ekibi
Şirket aynı zamanda Güvenlik Sistemleri ekibi adı verilen ve güvenlik raporlarını inceleyip bunları şirketin yöneticilerine ve yönetim kuruluna gönderecek bir danışma grubu da oluşturuyor. Yöneticiler karar alırken, yönetim kurulu bu kararları tersine çevirebilir.

OpenAI, “Güvenlik Sistemleri ekibi, yapay zeka modellerinin güvenliğini, sağlamlığını ve güvenilirliğini ve bunların gerçek dünyada konuşlandırılmasını sağlamaya kendini adamıştır” diye ekledi.

Güvenlik Sistemleri dört alt ekipten oluşur
OpenAI, bu ana ekibin mühendislik, araştırma, politika, insan-yapay zeka işbirliği ve ürün yönetimi alanlarında uzmanlardan oluşan dört alt ekibe sahip olacağını söyledi.

Güvenlik Mühendisliği: Ekip, ürünlere sistem düzeyinde azaltma uygular, güvenli, gizliliğe duyarlı, merkezi bir güvenlik hizmeti altyapısı oluşturur ve geniş ölçekte araştırma ve uygulama için makine öğrenimi merkezli araçlar oluşturur.

Model Güvenlik Araştırması: Bu ekip, OpenAI’nin modellerimizde sağlam ve güvenli davranışı tam olarak uygulamaya yönelik yeteneklerini geliştirecek.

Güvenlik Muhakeme Araştırması: Bu ekip, varsayılan güvenli model davranışı ve azaltımların tasarımına rehberlik etmek için hem bilinen hem de bilinmeyen riskleri tespit edecek ve anlayacaktır. Temel modele daha iyi güvenlik ve etik muhakeme becerileri ekleyerek hedefe doğru çalışacaktır.

İnsan-Yapay Zeka Etkileşimi: Son olarak bu ekip, “model davranışını istenen insani değerlerle hizalamaya yönelik arayüz olan politikayla ilgilenecek ve politikayı modeller ve modeller için birlikte tasarlıyoruz ve böylece politikalar doğrudan güvenlik sistemlerimize takılabilir.”

(Ajans girdileri ile)

FacebookheyecanLinkedIn

makalenin sonu

genel-9

OpenAI’nin yeni yönetim kurulu güvenlik kararlarını tersine çevirebilir

Byteknomers

By teknomers

Benzer İçerikler

Apple’ın AirPods Pro 2’si Neredeyse %40 İndirimli ve Bu Fiyatlandırmada Bir Hata Değil

Ai2’nin açık kaynak Tülu 3’ü herkesin AI eğitim sonrası oyununu oynamasına izin veriyor

Çin, Japonya’yı yarı iletken yaptırımlarını artırma konusunda uyardı – temel üretim malzemelerini engellemekle tehdit etti

Amazon’da En İyi Scuf Kontrol Cihazı Kara Cuma Fırsatları

Sea of Thieves Güncellemesi 1.000.021, 22 Kasım’da ÇıkıyorSea of Thieves Güncellemesi 1.000.021, 22 Kasım’da Çıkıyor

Manga Planet, TAKESHOBO’dan 6 Boys’ Love Başlığı Yayınlayacak

DualSense PS5 Kontrol Cihazları Kara Cuma İçin 2024 Yılının İlk Büyük İndirimlerini Aldı

Telefonunuzun kamerasının önüne koyduğunuz QR kodlarına gerçekten dikkat etmelisiniz.

Şimdiye kadarki en düşük fiyatıyla Motorola Razr+ (2024), bu Kara Cuma için gerçek bir fırsat

Sesli mesaj transkriptleri nihayet WhatsApp’a geliyor

Akıllı telefonunuzun sağlık özelliklerini kullanıyor musunuz?

Güneşimiz yeni bir simülasyonun yıldızı

Yaşamın kökeni araştırması, RNA’nın hem sol hem de sağ elini kullanan proteinleri destekleyebileceğini ortaya koyuyor

Gökbilimciler galaksimizin dışındaki bir yıldızın ilk yakın çekim fotoğrafını çekti

NASA’nın Swift’i geliştirilmiş işaretleme modunda 20. yıl dönümüne ulaştı

İlginizi Çekebilir

Apple’ın AirPods Pro 2’si Neredeyse %40 İndirimli ve Bu Fiyatlandırmada Bir Hata Değil

Jetour T2, Geely Monjaro’nun ana özelliğini aldı: artık ön panelde üç ekran var

Rockstar, GTA 5 PC güncellemesi öncesinde sessizce Bully üzerinde çalışıyor

Ai2’nin açık kaynak Tülu 3’ü herkesin AI eğitim sonrası oyununu oynamasına izin veriyor