Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Yeni Microsoft aracı, geliştiricilerin AI davranış testlerini metinle oluşturmasını sağlıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Yeni Microsoft aracı, geliştiricilerin AI davranış testlerini metinle oluşturmasını sağlıyor

Yapay Zeka

Yeni Microsoft aracı, geliştiricilerin AI davranış testlerini metinle oluşturmasını sağlıyor

teknomers
Son güncelleme: 2 Haziran 2026 22:51
teknomers
Paylaş
Paylaş

Yapay zeka alanında yapılan gelişmeler, teknolojik dünyayı bir adım öteye taşırken, bir yandan da bu sistemlerin güvenliği ve uyumluluğu konusunda yeni gereksinimleri gündeme getiriyor. Microsoft, bu ihtiyaca cevap olarak, AI sistemlerinin ürün ve hizmetlere göre istenen davranışları sergileyip sergilemediğini değerlendirmeyi kolaylaştıran ASSERT framework’ünü tanıttı.

Contents
  • ASSERT: Yapay Zeka Değerlendirmesinde Yeni Bir Dönem
  • Özelleştirilmiş Değerlendirmeler için Esneklik

ASSERT: Yapay Zeka Değerlendirmesinde Yeni Bir Dönem

ASSERT, “Adaptive Spec-driven Scoring for Evaluation and Regression Testing” kısaltmasıyla anılan açık kaynaklı bir çerçeve olarak, yüksek seviyedeki doğal dilde tanımlanmış hedeflerin, politikaların ve beklenen davranışların yapılandırılmış testlere dönüşmesini sağlıyor. Microsoft, bu platformun uygulama odaklı AI davranışlarını değerlendirmenin çok daha kolay hale geldiğini belirtiyor.

Bu aracın işleyiş biçimi, geliştiricilerin bir AI modelinin beklenen davranışını ve politikalarını düz bir dilde tanımlayabilmesi; ardından bu tanımların, kabul edilebilir ve kabul edilemez davranışların belirlenerek senaryolar ve test vakaları oluşturulmasına dönüşmesini kapsıyor. Sonuçlar puanlanırken, AI sisteminin hangi yolları izlediği de kaydediliyor, böylece geliştiriciler, sistemdeki hataların nerede meydana geldiğini inceleyebiliyorlar.

Özelleştirilmiş Değerlendirmeler için Esneklik

Geliştiriciler, değerlendirmelerin kapsamını daha da özelleştirmek için sistem bağlamını, araçları ve kısıtlamaları tanımlayabiliyorlar. Örneğin, bir belge araştırma AI ajanın, şirket dışındaki kişilere e-posta göndermemesi gerektiğini, gizli bilgileri yalnızca üst düzey yöneticilere iletmesini ve önceden belirlenmiş bağlamı göz önünde bulundurarak özlü özetler sağlamasını belirtmek mümkün. ASSERT, bu kurallara göre test senaryoları oluşturarak sistemin bu kurallara uyup uymadığını sürekli olarak kontrol ediyor.

Microsoft’a göre, ASSERT, AI modellerinin belirli uygulamaların veya ürünlerin bağlamına, politikalarına ve kullanılan araçlara göre şekillenen özel davranışlar sergileyip sergilemediğini değerlendirmek için genel değerlendirmelerin ötesinde bir boşluğu dolduruyor. Microsoft’un Sorumlu AI Ürün Direktörü Sarah Bird, “Değerlendirmeler, iyi kararlar almak için kritik öneme sahiptir,” ifadelerini kullanarak sistemlerin güvenilirliği ve doğruluğu üzerindeki önemini vurguladı. Bird, ASSERT’ın, sistemlerin inşa edildiği, dağıtım sonrası ya da sürekli izleme amacıyla değerlendirilmesinde kullanılabileceğini belirtti.

Bu açıklamalar, yapay zeka endüstrisindeki daha geniş bir dönüşümün ortasında şekilleniyor. Modellerin yetenekleri geliştikçe, araştırmacıların tekrarlanabilir testler ve regresyon kontrollerine odaklandığı görülüyor; örneğin Stanford’un HELM’i ve MLCommons’ün AILuminate’ı gibi gruplar, modellerin çeşitli koşullar altında nasıl davrandığını ölçen kıyaslamalar sunmaya başladı.

Kaynak: https://techcrunch.com/2026/06/02/new-microsoft-tool-lets-devs-spin-up-ai-behavior-tests-using-text-descriptions/

OpenAI, AI kişisel finans girişimi Hiro’yu satın aldı
Müzik Yayıncıları, Anthropic’i 20.000 Eser için 3 Milyar Dolarla Dava Etti
Runway, 315M$ fonla 5.3M$ değerlemesini artırıyor
Anthropic 65 Milyar Dolar topladı, IPO öncesi 1 Trilyon değerine yaklaşımda
Teknoloji CEO’ları AI psikozu mu yaşıyor?
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Microsoft, 2029’da pratik bir Majorana 2 kuantum çipi sunacak
Sonraki Makale DOGE İfşası Sonrası Tehlikeli Olay: Frenleri Kesildi!

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Tanrıların İntikamı: God of War Laufey’de Sürpriz Karakterler Bekleniyor
Oyun
JMGO N3 Ultimate projektör, yeni taşınabilir 4K şampiyonu mu?
Liste
Laravel AI SDK ile ReAct Sohbet Ajanı Geliştirme
Yazılım
Final Fantasy Revelasyonu: Definitif Son Ama Yan Hikayelere Kapı Aralıyor
Oyun
Final Fantasy 7’de Bulut’u Kara Büyücüye Dönüştüren Yenilikçi Sistem
Oyun
Yenilenen Korku Hikayesi: Michael Myers Maskesi ve Bıçağını Buldu
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?