Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Yeni Microsoft aracı, geliştiricilerin AI davranış testlerini metinle oluşturmasını sağlıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Yeni Microsoft aracı, geliştiricilerin AI davranış testlerini metinle oluşturmasını sağlıyor

Yapay Zeka

Yeni Microsoft aracı, geliştiricilerin AI davranış testlerini metinle oluşturmasını sağlıyor

teknomers
Son güncelleme: 2 Haziran 2026 22:51
teknomers
Paylaş
Paylaş

Yapay zeka alanında yapılan gelişmeler, teknolojik dünyayı bir adım öteye taşırken, bir yandan da bu sistemlerin güvenliği ve uyumluluğu konusunda yeni gereksinimleri gündeme getiriyor. Microsoft, bu ihtiyaca cevap olarak, AI sistemlerinin ürün ve hizmetlere göre istenen davranışları sergileyip sergilemediğini değerlendirmeyi kolaylaştıran ASSERT framework’ünü tanıttı.

Contents
  • ASSERT: Yapay Zeka Değerlendirmesinde Yeni Bir Dönem
  • Özelleştirilmiş Değerlendirmeler için Esneklik

ASSERT: Yapay Zeka Değerlendirmesinde Yeni Bir Dönem

ASSERT, “Adaptive Spec-driven Scoring for Evaluation and Regression Testing” kısaltmasıyla anılan açık kaynaklı bir çerçeve olarak, yüksek seviyedeki doğal dilde tanımlanmış hedeflerin, politikaların ve beklenen davranışların yapılandırılmış testlere dönüşmesini sağlıyor. Microsoft, bu platformun uygulama odaklı AI davranışlarını değerlendirmenin çok daha kolay hale geldiğini belirtiyor.

Bu aracın işleyiş biçimi, geliştiricilerin bir AI modelinin beklenen davranışını ve politikalarını düz bir dilde tanımlayabilmesi; ardından bu tanımların, kabul edilebilir ve kabul edilemez davranışların belirlenerek senaryolar ve test vakaları oluşturulmasına dönüşmesini kapsıyor. Sonuçlar puanlanırken, AI sisteminin hangi yolları izlediği de kaydediliyor, böylece geliştiriciler, sistemdeki hataların nerede meydana geldiğini inceleyebiliyorlar.

Özelleştirilmiş Değerlendirmeler için Esneklik

Geliştiriciler, değerlendirmelerin kapsamını daha da özelleştirmek için sistem bağlamını, araçları ve kısıtlamaları tanımlayabiliyorlar. Örneğin, bir belge araştırma AI ajanın, şirket dışındaki kişilere e-posta göndermemesi gerektiğini, gizli bilgileri yalnızca üst düzey yöneticilere iletmesini ve önceden belirlenmiş bağlamı göz önünde bulundurarak özlü özetler sağlamasını belirtmek mümkün. ASSERT, bu kurallara göre test senaryoları oluşturarak sistemin bu kurallara uyup uymadığını sürekli olarak kontrol ediyor.

Microsoft’a göre, ASSERT, AI modellerinin belirli uygulamaların veya ürünlerin bağlamına, politikalarına ve kullanılan araçlara göre şekillenen özel davranışlar sergileyip sergilemediğini değerlendirmek için genel değerlendirmelerin ötesinde bir boşluğu dolduruyor. Microsoft’un Sorumlu AI Ürün Direktörü Sarah Bird, “Değerlendirmeler, iyi kararlar almak için kritik öneme sahiptir,” ifadelerini kullanarak sistemlerin güvenilirliği ve doğruluğu üzerindeki önemini vurguladı. Bird, ASSERT’ın, sistemlerin inşa edildiği, dağıtım sonrası ya da sürekli izleme amacıyla değerlendirilmesinde kullanılabileceğini belirtti.

Bu açıklamalar, yapay zeka endüstrisindeki daha geniş bir dönüşümün ortasında şekilleniyor. Modellerin yetenekleri geliştikçe, araştırmacıların tekrarlanabilir testler ve regresyon kontrollerine odaklandığı görülüyor; örneğin Stanford’un HELM’i ve MLCommons’ün AILuminate’ı gibi gruplar, modellerin çeşitli koşullar altında nasıl davrandığını ölçen kıyaslamalar sunmaya başladı.

Kaynak: https://techcrunch.com/2026/06/02/new-microsoft-tool-lets-devs-spin-up-ai-behavior-tests-using-text-descriptions/

Yapay Zeka İşten Çıkarma mı, Yoksa Yanıltma mı?
Anthropic, Bengaluru genişlemesi için eski Microsoft India MD’yi seçti
General Catalyst, Hindistan’a 5 yılda 5 milyar yatırım yapacak
Yapay Zeka Altyapısına Yönelik Halk Karşıtlığı Artıyor
Patreon CEO’su: AI şirketlerinin adil kullanım savı geçersiz, yaratıcılar maaş almalı
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Microsoft, 2029’da pratik bir Majorana 2 kuantum çipi sunacak
Sonraki Makale DOGE İfşası Sonrası Tehlikeli Olay: Frenleri Kesildi!

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Kritik Uyarı: 2026 FIFA Dünya Kupası Dolandırıcılıklarına Dikkat!
Siber Güvenlik
Acil! Cisco, SD-WAN’da yamanmamış sıfır gün açığına dikkat çekti
Siber Güvenlik
Surface Laptop Ultra’nın RTX Spark Süper Çip için 110W TDP hedefi
Donanım
Acil: PCPJack 230 AWS ve Google Cloud Sunucusunu Ele Geçirdi!
Siber Güvenlik
Bellek Çökmesi Yaşamadan Milyonları İşleme: Laravel Lazy Collections
Yazılım
Frore, Nvidia Vera Rubin için LiquidJet Nexus soğutucusunu tanıttı
Donanım
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?