Meta, yapay zeka güvenliği için açık kaynaklı araçları piyasaya sürüyor

Meta, geliştiricilerin genel kullanıma sunulmadan önce üretken yapay zeka modellerinin güvenilirliğini ve emniyetini değerlendirip artırmalarına yönelik açık kaynaklı araçlar oluşturmaya adanmış bir proje olan Purple Llama’yı tanıttı.

Meta, yapay zeka sorunlarının tek başına ele alınamayacağını belirterek, yapay zeka güvenliğini sağlamak için işbirlikçi çabalara duyulan ihtiyacı vurguladı. Şirket, Mor Lama’nın amacının daha güvenli gen AI geliştirmek için ortak bir temel oluşturmak olduğunu söyledi. endişeler arttıkça büyük dil modelleri ve diğer yapay zeka teknolojileri hakkında.

Meta, “Yapay zeka sistemleri kuran insanlar yapay zekanın zorluklarını bir boşlukta çözemezler, bu yüzden oyun alanını eşitlemek ve açık güven ve emniyet için bir kitle merkezi yaratmak istiyoruz” diye yazdı. Blog yazısı.

Siber güvenlik firması Ontinue’nun Baş Bilgi Güvenliği Sorumlusu Gareth Lindahl-Wise, Mor Lama’yı daha güvenli yapay zekaya yönelik “olumlu ve proaktif” bir adım olarak nitelendirdi.

“Kuşkusuz, gelişimi bir platformda toplama konusunda bazı erdem sinyali veya art niyet iddiaları olacaktır – ancak gerçekte, ‘alışılmışın dışında’ daha iyi tüketici düzeyinde koruma faydalı olacaktır” diye ekledi. “Sıkı şirket içi, müşteri veya düzenleyici yükümlülüklere sahip kuruluşların elbette yine de Meta’nın sunduğu tekliflerin ötesinde sağlam değerlendirmeleri takip etmesi gerekecek, ancak potansiyel Vahşi Batı’da hüküm sürmeye yardımcı olabilecek her şey ekosistem için iyidir.”

Proje, yapay zeka geliştiricileriyle ortaklıklar içeriyor; AWS ve Google Cloud gibi bulut hizmetleri; Intel, AMD ve Nvidia gibi yarı iletken şirketleri; ve Microsoft dahil yazılım firmaları. İşbirliği, yapay zeka modellerinin yeteneklerini test etmek ve güvenlik risklerini belirlemek için hem araştırma hem de ticari kullanıma yönelik araçlar üretmeyi amaçlıyor.

Purple Llama aracılığıyla piyasaya sürülen ilk araç seti şunları içerir: Siber GüvenlikEvalYapay zeka tarafından oluşturulan yazılımlardaki siber güvenlik risklerini değerlendiren. Şiddet veya yasa dışı faaliyetlerle ilgili tartışmalar da dahil olmak üzere uygunsuz veya zararlı metinleri tanımlayan bir dil modeli içerir. Geliştiriciler, yapay zeka modellerinin güvenli olmayan kod oluşturmaya veya siber saldırılara yardım etmeye yatkın olup olmadığını test etmek için CyberSecEval’i kullanabilir. Meta’nın araştırması, büyük dil modellerinin genellikle savunmasız kodlara işaret ettiğini ve yapay zeka güvenliği için sürekli test ve iyileştirmenin önemini vurguladığını buldu.

Lama Muhafızı Bu paketteki başka bir araçtır; potansiyel olarak zararlı veya rahatsız edici dili tanımlamak için eğitilmiş büyük bir dil modelidir. Geliştiriciler, modellerinin güvenli olmayan içerik üretip üretmediğini veya kabul edip etmediğini test etmek için Llama Guard’ı kullanabilir ve uygunsuz çıktılara yol açabilecek istemlerin filtrelenmesine yardımcı olabilir.

genel-13

Meta, yapay zeka güvenliği için açık kaynaklı araçları piyasaya sürüyor

Byteknomers

By teknomers

Benzer İçerikler

Yapay Zeka Amerika’nın Elektrik Şebekesini Riske Atıyor

İşte Sandisk yeniden markalamayla geliyor

NASA Uydu Görüntüsü, Antarktika’daki Eşsiz At Nalı Şeklindeki Aldatma Adasını Ortaya Çıkardı

Nintendo Switch’in 2024 Yılı İncelemesi Şimdi Yayında, Ücretsiz 2025 Takvimi Alın

CD Projekt Red, Gwent’in The Witcher 4’e geri döneceğini ima ediyor, dolayısıyla tüm boş zamanlarım boşa gidiyor

Noel için Tek İstediğiniz Fortnite’ta Mariah Carey ise Şanslısınız

Sonic The Hedgehog 3 Harika Rotten Tomatoes Skoru Aldı!

Web’deki Apple Haritalar, yakın zamanda yapılan bir güncellemeyle çok ihtiyaç duyulan bir özelliğe kavuşuyor

Bunlar Find X8 Ultra’daki dört arka kameraya ait dört sensördür

Altı yıl sonra Meta, veri ihlali nedeniyle çeyrek milyar dolar para cezasına çarptırıldı

%30 indirimle uygun fiyatlı OnePlus Buds 3, bütçesi kısıtlı olan kullanıcılar için mutlaka sahip olunması gereken bir ürün

NASA, eski verileri ve yeni teknikleri kullanarak ‘yan’ kara delik buluyor

Yılın son meteor yağmuru Noel’den birkaç gün önce zirveye çıkıyor

NASA, uzay istasyonunda mahsur kalan astronotların dönüşünü bir kez daha erteledi

SpaceX, 20 saat içinde 3 roket fırlatmayı ve 1 Dragon inişini hedefliyor

İlginizi Çekebilir

T-Mobile’ın Çalışanların T-Life Uygulama İndirmelerini Arttırmaya Yönelik Agresif Girişimi Büyüyen Bir Endişeye Yol Açıyor

Toyota Land Cruiser Prado ve Kia Mohave’nin değiştirilmesi. Büyük çerçeve SUV BAIC BJ60 ve iki SUV daha Rusya’da piyasaya sürülecek

Yapay Zeka Amerika’nın Elektrik Şebekesini Riske Atıyor

İşte Sandisk yeniden markalamayla geliyor