Meta, yapay zeka güvenliği için açık kaynaklı araçları piyasaya sürüyor

Meta, geliştiricilerin genel kullanıma sunulmadan önce üretken yapay zeka modellerinin güvenilirliğini ve emniyetini değerlendirip artırmalarına yönelik açık kaynaklı araçlar oluşturmaya adanmış bir proje olan Purple Llama’yı tanıttı.

Meta, yapay zeka sorunlarının tek başına ele alınamayacağını belirterek, yapay zeka güvenliğini sağlamak için işbirlikçi çabalara duyulan ihtiyacı vurguladı. Şirket, Mor Lama’nın amacının daha güvenli gen AI geliştirmek için ortak bir temel oluşturmak olduğunu söyledi. endişeler arttıkça büyük dil modelleri ve diğer yapay zeka teknolojileri hakkında.

Meta, “Yapay zeka sistemleri kuran insanlar yapay zekanın zorluklarını bir boşlukta çözemezler, bu yüzden oyun alanını eşitlemek ve açık güven ve emniyet için bir kitle merkezi yaratmak istiyoruz” diye yazdı. Blog yazısı.

Siber güvenlik firması Ontinue’nun Baş Bilgi Güvenliği Sorumlusu Gareth Lindahl-Wise, Mor Lama’yı daha güvenli yapay zekaya yönelik “olumlu ve proaktif” bir adım olarak nitelendirdi.

“Kuşkusuz, gelişimi bir platformda toplama konusunda bazı erdem sinyali veya art niyet iddiaları olacaktır – ancak gerçekte, ‘alışılmışın dışında’ daha iyi tüketici düzeyinde koruma faydalı olacaktır” diye ekledi. “Sıkı şirket içi, müşteri veya düzenleyici yükümlülüklere sahip kuruluşların elbette yine de Meta’nın sunduğu tekliflerin ötesinde sağlam değerlendirmeleri takip etmesi gerekecek, ancak potansiyel Vahşi Batı’da hüküm sürmeye yardımcı olabilecek her şey ekosistem için iyidir.”

Proje, yapay zeka geliştiricileriyle ortaklıklar içeriyor; AWS ve Google Cloud gibi bulut hizmetleri; Intel, AMD ve Nvidia gibi yarı iletken şirketleri; ve Microsoft dahil yazılım firmaları. İşbirliği, yapay zeka modellerinin yeteneklerini test etmek ve güvenlik risklerini belirlemek için hem araştırma hem de ticari kullanıma yönelik araçlar üretmeyi amaçlıyor.

Purple Llama aracılığıyla piyasaya sürülen ilk araç seti şunları içerir: Siber GüvenlikEvalYapay zeka tarafından oluşturulan yazılımlardaki siber güvenlik risklerini değerlendiren. Şiddet veya yasa dışı faaliyetlerle ilgili tartışmalar da dahil olmak üzere uygunsuz veya zararlı metinleri tanımlayan bir dil modeli içerir. Geliştiriciler, yapay zeka modellerinin güvenli olmayan kod oluşturmaya veya siber saldırılara yardım etmeye yatkın olup olmadığını test etmek için CyberSecEval’i kullanabilir. Meta’nın araştırması, büyük dil modellerinin genellikle savunmasız kodlara işaret ettiğini ve yapay zeka güvenliği için sürekli test ve iyileştirmenin önemini vurguladığını buldu.

Lama Muhafızı Bu paketteki başka bir araçtır; potansiyel olarak zararlı veya rahatsız edici dili tanımlamak için eğitilmiş büyük bir dil modelidir. Geliştiriciler, modellerinin güvenli olmayan içerik üretip üretmediğini veya kabul edip etmediğini test etmek için Llama Guard’ı kullanabilir ve uygunsuz çıktılara yol açabilecek istemlerin filtrelenmesine yardımcı olabilir.

genel-13

Meta, yapay zeka güvenliği için açık kaynaklı araçları piyasaya sürüyor

Byteknomers

By teknomers

Benzer İçerikler

Ray-Ban Meta Gözlükleri Shazam Entegrasyonunu Sağlıyor ve Hareket Halindeyken Eller Serbest Müzik Tanımlamayı Sağlıyor

%30 indirimle uygun fiyatlı OnePlus Buds 3, bütçesi kısıtlı olan kullanıcılar için mutlaka sahip olunması gereken bir ürün

Japon Startup’ın İkinci Yörüngesel Fırlatma Denemesi, Kairos Roketinin Kendini İmha Etmesiyle Başarısızlıkla Sona Erdi

Epic Games, Fortnite Turnuvasında Hile Yapan Kişiye Dava Açtı

Bugün NYT Connections — 19 Aralık Perşembe için ipuçlarım ve cevaplarım (oyun #557)

Bu ay sadece 1$ karşılığında Far Cry 6 ve 100’den fazla oyunu oynayın

Sonic Dream Team, Sonic The Hedgehog 3’ü Kutlamak İçin Gölge Ekliyor

Amazon ve Best Buy, Noel’den hemen önce 240 dolarlık nadir Motorola Razr+ (2024) indirimi sunuyor

Apple, iPhone abonelik planını daha piyasaya sürülmeden iptal etmeye karar verdi

Fitbit’in Kardiyo Yükü ve Hedef Yükü artık daha fazla akıllı saate geliyor

4G’ye hazır Lenovo Tab K11 bir kez daha 200 doların altına düştü

NASA, eski verileri ve yeni teknikleri kullanarak ‘yan’ kara delik buluyor

Yılın son meteor yağmuru Noel’den birkaç gün önce zirveye çıkıyor

NASA, uzay istasyonunda mahsur kalan astronotların dönüşünü bir kez daha erteledi

SpaceX, 20 saat içinde 3 roket fırlatmayı ve 1 Dragon inişini hedefliyor

İlginizi Çekebilir

Ray-Ban Meta Gözlükleri Shazam Entegrasyonunu Sağlıyor ve Hareket Halindeyken Eller Serbest Müzik Tanımlamayı Sağlıyor

Zenless Zone Zero 1.4 tonlarca ücretsiz Polychrome dağıtıyor ve Miyabi’yi çekiyor

Epic Games, Fortnite Turnuvasında Hile Yapan Kişiye Dava Açtı

%30 indirimle uygun fiyatlı OnePlus Buds 3, bütçesi kısıtlı olan kullanıcılar için mutlaka sahip olunması gereken bir ürün