Microsoft'un yeni güvenlik sistemi, müşterilerinin yapay zeka uygulamalarında halüsinasyonları yakalayabilir - Dünyadan Güncel Teknoloji Haberleri

Microsoft’un yeni güvenlik sistemi, müşterilerinin yapay zeka uygulamalarında halüsinasyonları yakalayabilir

Microsoft’un sorumlu yapay zekadan sorumlu baş ürün sorumlusu Sarah Bird şunları söylüyor: Sınır bir röportajda ekibinin, oluşturdukları yapay zeka hizmetlerini test etmek için kırmızı ekip üyesi gruplarını işe almayan Azure müşterileri için kullanımı kolay olacak birkaç yeni güvenlik özelliği tasarladığını söyledi. Microsoft Yüksek Lisans destekli bu araçların potansiyel güvenlik açıklarını tespit edebildiğini söylüyor“makul olan ancak desteklenmeyen” halüsinasyonları izleyin ve platformda barındırılan herhangi bir modelle çalışan Azure AI müşterileri için kötü amaçlı istemleri gerçek zamanlı olarak engelleyin.

“Müşterilerimizin hepsinin anlık enjeksiyon saldırıları veya nefret dolu içerik konusunda derin bir uzmanlığa sahip olmadığını biliyoruz, dolayısıyla değerlendirme sistemi bu tür saldırıları simüle etmek için gereken istemleri üretiyor. Müşteriler daha sonra bir puan alabilir ve sonuçları görebilirler” diyor.

Üç özellik: Uyarı Kalkanlarımodellere eğitimlerine aykırı davranma talimatı veren harici belgelerden gelen istem enjeksiyonlarını veya kötü niyetli istemleri engelleyen; Topraklama Tespitihalüsinasyonları bulup engelleyen; Ve güvenlik değerlendirmeleriModel güvenlik açıklarını değerlendiren . Modelleri güvenli çıktılara yönlendirmeye ve potansiyel sorunlu kullanıcıları işaretlemek için istemleri izlemeye yönelik diğer iki özellik de yakında gelecek.

Kullanıcı ister bir bilgi istemi yazıyor olsun, ister model üçüncü taraf verilerini işliyor olsun, izleme sistemi, yanıtlaması için modele göndermeye karar vermeden önce herhangi bir yasaklı kelimeyi tetikleyip tetiklemediğini veya gizli istemler içerip içermediğini görmek için bunu değerlendirecektir. Daha sonra sistem, modelin yanıtına bakar ve modelin belgede veya bilgi isteminde olmayan bilgilerin halüsinasyon görüp görmediğini kontrol eder.

Google Gemini görüntüleri örneğinde, önyargıyı azaltmak için yapılan filtrelerin istenmeyen etkileri oldu; Microsoft, Azure AI araçlarının daha özelleştirilmiş kontrole izin vereceğini söylediği bir alandır. Bird, Microsoft ve diğer şirketlerin yapay zeka modelleri için neyin uygun olup olmadığına karar verme konusunda endişeler bulunduğunu kabul ediyor ve bu nedenle ekibi, Azure müşterilerinin modelin gördüğü ve engellediği nefret söylemi veya şiddet filtrelemesini değiştirebilecek bir yol ekledi.

Gelecekte Azure kullanıcıları Ayrıca kullanıcıların raporunu da alabilirsiniz Güvenli olmayan çıktıları tetiklemeye çalışan kişiler. Bird, bunun sistem yöneticilerine hangi kullanıcıların kendi kırmızı ekip ekibi olduğunu ve hangilerinin daha kötü niyetli kişiler olabileceğini anlamalarına olanak tanıdığını söylüyor.

Bird, güvenlik özelliklerinin GPT-4’e ve Llama 2 gibi diğer popüler modellere anında “eklendiğini” söylüyor. Ancak Azure’un model bahçesi birçok yapay zeka modeli içerdiğinden, daha küçük, daha az kullanılan açık kaynaklı sistem kullanıcılarının güvenliği manuel olarak işaretlemeleri gerekebilir. modellere ait özellikler.

genel-2

Microsoft’un yeni güvenlik sistemi, müşterilerinin yapay zeka uygulamalarında halüsinasyonları yakalayabilir

Byteknomers

By teknomers

Benzer İçerikler

Bu 32 inç 4K kavisli Dell monitörün fiyatı Amazon’da yalnızca 249 ABD dolarıdır

Büyük sızıntı, Apple’ın yeni Beats Solo Buds ve Beats Solo 4’ün görsellerini, videosunu ve çıkış tarihini ortaya koyuyor

Mini LED ekranlı yeni Apple iPad Air mi? Köpek yavrusu pastası!

Warframe’in “Jade Shadows” Tek Oyunculu Anlatı Görevi Haziran’da Çıkıyor

Tek Oyunculu Parti Tabanlı Soulslike Deathbound PS5, Xbox Series X|S ve PC’ye Geliyor

Tamamen yok edilebilir RTS, robotik düşmanların gelgitleriyle yüzleştiğinizi görüyor

XDefiant’ın Çıkış Tarihi “Çok Yakında” Geliştiriciler “Gerçekten İyi” Hissetti Test Nasıl Geçti?

Apple, reklamlarında AI pornosu oluşturabileceğini iddia eden üç uygulamayı App Store’dan kaldırdı

Samsung İnternet Tarayıcısı Beta uygulaması kullanışlı yeni özellikler ekliyor

iPhone 16: Bilmeniz gereken en önemli 7 söylenti

Apple, iPhone kullanıcılarını gece boyunca iPhone şarjı konusunda uyarıyor

Yıldızlararası Peptitler Yaşamın Yapı Taşlarının Dünya Dışı Kökenine İşaret Ediyor

TESS ilk haydut gezegenini buldu

Astronotlar, Boeing’in Starliner uzay aracının ilk ekibi olarak Kennedy Uzay Merkezi’ne geldi

Uzaya Kaçarken Yakalanan Karbon ve Oksijen

İlginizi Çekebilir

Einstein’ın Mirası Muazzam Kara Delik Keşfiyle Bir Kez Daha Kanıtlandı

Bu 32 inç 4K kavisli Dell monitörün fiyatı Amazon’da yalnızca 249 ABD dolarıdır

Büyük sızıntı, Apple’ın yeni Beats Solo Buds ve Beats Solo 4’ün görsellerini, videosunu ve çıkış tarihini ortaya koyuyor

NYT Strands: 28 Nisan Pazar gününün yanıtları