Anthropic, Yapay Zeka Modellerini Değerlendirmek İçin Yeni Üçüncü Taraf Yapay Zeka Ölçütleri Geliştirme Girişimini Finanse Edecek

Anthropic, Salı günü gelişmiş yapay zeka (AI) modellerinin yeteneklerini test etmek için yeni kıyaslamalar geliştirmek üzere yeni bir girişim duyurdu. AI firması projeyi finanse edecek ve ilgili kuruluşlardan başvurular davet etti. Şirket, mevcut kıyaslamaların yeni büyük dil modellerinin (LLM) yeteneklerini ve etkisini tam olarak test etmek için yeterli olmadığını söyledi. Sonuç olarak, AI güvenliği, gelişmiş yetenekleri ve toplumsal etkisine odaklanan yeni bir değerlendirme setinin geliştirilmesi gerekiyor, dedi Anthropic.

Anthropic, yapay zeka modelleri için yeni ölçütleri finanse edecek

Bir haber odasında postalamakAnthropic, mevcut kıstasların sınırlı kapsamını aşmak için kapsamlı bir üçüncü taraf değerlendirme ekosistemine ihtiyaç duyulduğunu vurguladı. Yapay zeka firması, girişimi aracılığıyla kalite ve yüksek güvenlik standartlarına odaklanan yapay zeka modelleri için yeni değerlendirmeler geliştirmek isteyen üçüncü taraf kuruluşlara fon sağlayacağını duyurdu.

Anthropic için yüksek öncelikli alanlar arasında bir LLM’nin Yapay Zeka Güvenlik Seviyelerini (ASL’ler) ölçebilen görevler ve sorular, fikir ve yanıt üretmedeki gelişmiş yetenekler ve bu yeteneklerin toplumsal etkisi yer alıyor.

Şirket, ASL kategorisi altında yapay zeka modellerinin siber saldırıları yürütmede otonom olarak hareket etme veya yardımcı olma kabiliyeti, modellerin kimyasal, biyolojik, radyolojik ve nükleer (KBRN) risklerin yaratılmasına veya bu risklere ilişkin bilginin geliştirilmesine yardımcı olma potansiyeli, ulusal güvenlik risk değerlendirmesi ve daha fazlasını içeren çeşitli parametreleri vurguladı.

Gelişmiş yetenekler açısından Anthropic, kıyaslamaların AI’nın bilimsel araştırmayı dönüştürme potansiyelini, zararlılığa katılımı ve reddetmeyi ve çok dilli yetenekleri değerlendirebilmesi gerektiğini vurguladı. Ayrıca, AI firması bir AI modelinin toplumu etkileme potansiyelini anlamak gerektiğini söyledi. Bunun için değerlendirmeler “zararlı önyargılar, ayrımcılık, aşırı güven, bağımlılık, bağlanma, psikolojik etki, ekonomik etkiler, homojenleştirme ve diğer geniş toplumsal etkiler” gibi kavramları hedef alabilmelidir.

Bunun dışında, AI firması iyi değerlendirmeler için bazı prensipler de sıraladı. AI tarafından kullanılan eğitim verilerinde değerlendirmelerin bulunmaması gerektiğini, çünkü bunun genellikle modeller için bir ezberleme testine dönüştüğünü söyledi. Ayrıca AI’yı test etmek için 1.000 ila 10.000 görev veya soru tutulmasını teşvik etti. Ayrıca kuruluşlardan belirli bir alandaki performansı test eden görevler oluşturmak için konu uzmanlarını kullanmalarını istedi.

Ortaklık bağlantıları otomatik olarak oluşturulabilir – ayrıntılar için etik bildirimimizi inceleyin.

genel-8

Anthropic, Yapay Zeka Modellerini Değerlendirmek İçin Yeni Üçüncü Taraf Yapay Zeka Ölçütleri Geliştirme Girişimini Finanse Edecek

Byteknomers

Anthropic, yapay zeka modelleri için yeni ölçütleri finanse edecek

By teknomers

Benzer İçerikler

Google Meet’in otomatik çerçeveleme özelliği artık herkesin kullanımına açık

NASA, Ay’ın Dünya’dan Uzaklaşmasının Nedenini Açıkladı

Tracsis, demiryolu operatörlerinin teknoloji konusunda ‘uzun vadeli yatırım kararlarıyla mücadele ettiğini’ söylüyor

HIDIVE Insomniacs’ın Okul Sonrası İngilizce Dub Kadrosunu Duyurdu

All Once Human Twitch yayınları ve nasıl talep edileceği

PlayStation Portal bulut akışı artık beta sürümde ve PS Plus Premium üyeleri için 120’den fazla oyun oynanabilir

Guilty Gear Strive Güncellemesi 1.41, 20 Kasım’da Team of 3 Modunu Yayınlıyor Guilty Gear Strive Güncellemesi 1.41, Team of 3 Modunu 20 Kasım’da Yayınlıyor

Bugüne kadarki en büyük Samsung Galaxy Tab A9+ anlaşması Kara Cuma’dan hemen önce geliyor

Garmin’in en etkileyici akıllı saatlerinden biri, Kara Cuma öncesi inanılmaz bir indirimle satışta

Android 16, Health Connect’e tıbbi kayıt desteği getirebilir

Google, “Çizmeme yardım et” üretken yapay zeka özelliği üzerinde çalışmaya devam ediyor

Yeni DESI verileri yerçekiminin evrendeki çekişine ışık tutuyor

Kümelerde keşfedilen beyaz cüce-ana dizi ikili dosyalarının ilk çiftleri, yıldızların evrimine yeni bir ışık tutuyor

Proba-3’ün güneşin koronasını görme yolculuğu

SpaceX, Starship’in bir sonraki uçuşuna hazırlanıyor

İlginizi Çekebilir

Final Fantasy 14 mobil gerçek ve MMO’nun ilk günlerini yeniden yaratıyor

İşçiler Volkswagen’i, Almanya’nın “on yıllardır görmediği” benzeri görülmemiş grev ve çatışmalarla tehdit ediyor

Google Meet’in otomatik çerçeveleme özelliği artık herkesin kullanımına açık

NASA, Ay’ın Dünya’dan Uzaklaşmasının Nedenini Açıkladı