Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Amazon, AI modellerini test etmek için insan kıyaslama ekipleri sunacak
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Amazon, AI modellerini test etmek için insan kıyaslama ekipleri sunacak

Liste

Amazon, AI modellerini test etmek için insan kıyaslama ekipleri sunacak

teknomers
Son güncelleme: 30 Kasım 2023 02:39
teknomers
Paylaş
Paylaş


Amazon, kullanıcıların yapay zeka modellerini daha iyi değerlendirmesini ve daha fazla insanın sürece dahil olmasını teşvik etmesini istiyor.

AWS re: Invent konferansı sırasında AWS veritabanı, analitik ve makine öğreniminden sorumlu başkan yardımcısı Swami Sivasubramanian şunu duyurdu: Ana Kaya Üzerinde Model DeğerlendirmesiAmazon Bedrock deposunda bulunan modeller için artık önizlemede mevcut. Modelleri şeffaf bir şekilde test etmenin bir yolu olmadığında geliştiriciler, bir soru-cevap projesi için yeterince doğru olmayan veya kullanım durumları için çok büyük olanları kullanmaya başlayabilirler.

Sivasubramanian, “Model seçimi ve değerlendirmesi sadece başlangıçta yapılmaz, periyodik olarak tekrarlanan bir şeydir” dedi. “Döngüde bir insanın olmasının önemli olduğunu düşünüyoruz, bu nedenle insan değerlendirme iş akışlarını ve model performansı ölçümlerini kolayca yönetmenin bir yolunu sunuyoruz.”

Sivasubramanyan anlattı Sınır ayrı bir röportajda, bazı geliştiricilerin proje için daha büyük bir model kullanmaları gerekip gerekmediğini bilmediklerini çünkü daha güçlü bir modelin ihtiyaçlarını karşılayacağını varsaydıklarını söyledi. Daha sonra daha küçük bir tane üzerine inşa edebileceklerini anladılar.

Model Değerlendirmenin iki bileşeni vardır: otomatik değerlendirme ve insan değerlendirmesi. Otomatik versiyonda geliştiriciler Bedrock konsoluna gidip test edecekleri bir model seçebilirler. Daha sonra özetleme, metin sınıflandırma, soru-cevap ve metin oluşturma gibi görevler için modelin sağlamlık, doğruluk veya toksisite gibi ölçümlere ilişkin performansını değerlendirebilirler. Bedrock, Meta’nın Llama 2’si, Anthropic’in Claude 2’si ve Stability AI’nin Stable Diffusion’ı gibi popüler üçüncü taraf AI modellerini içerir.

AWS test veri kümeleri sağlarken müşteriler kendi verilerini kıyaslama platformuna getirebilir ve böylece modellerin nasıl davrandığı konusunda daha iyi bilgi sahibi olabilirler. Daha sonra sistem bir rapor oluşturur.

İnsanların dahil olması durumunda kullanıcılar, bir AWS insan değerlendirme ekibiyle veya kendi ekipleriyle çalışmayı seçebilir. Müşterilerin, kullanmak istedikleri görev türünü (örneğin özetleme veya metin oluşturma), değerlendirme ölçümlerini ve veri kümesini belirtmesi gerekir. AWS, değerlendirme ekibiyle çalışanlar için özelleştirilmiş fiyatlandırma ve zaman çizelgeleri sağlayacaktır.

AWS’nin üretken yapay zekadan sorumlu başkan yardımcısı Vasi Philomin şunları söyledi: Sınır Modellerin nasıl performans gösterdiğini daha iyi anlamanın gelişimi daha iyi yönlendirdiğini belirten bir röportajda. Bu aynı zamanda şirketlerin, modeli kullanmadan önce modellerin (daha düşük veya çok yüksek toksisite hassasiyetleri gibi) bazı sorumlu AI standartlarını karşılayıp karşılamadığını görmesine olanak tanır.

Philomin, “Modellerin müşterilerimiz için işe yaraması, hangi modelin kendilerine en uygun olduğunu bilmeleri önemlidir ve biz de onlara bunu daha iyi değerlendirebilmeleri için bir yol sağlıyoruz” dedi.

Sivasubramanian ayrıca, insanların yapay zeka modellerini değerlendirirken otomatik sistemin tespit edemediği empati veya samimiyet gibi diğer ölçümleri de tespit edebildiklerini söyledi.

Philomin, AWS’nin tüm müşterilerin modelleri karşılaştırmasını gerektirmeyeceğini, çünkü bazı geliştiricilerin Bedrock’taki bazı temel modellerle daha önce çalışmış olabileceğini veya modellerin onlar için neler yapabileceğine dair bir fikre sahip olabileceğini söyledi. Halen hangi modellerin kullanılacağını araştıran şirketler, kıyaslama sürecinden geçmenin faydasını görebilir.

AWS, kıyaslama hizmeti önizleme aşamasındayken yalnızca değerlendirme sırasında kullanılan model çıkarımı için ücret alacağını söyledi.

Yapay zeka modellerini kıyaslamak için belirli bir standart olmasa da bazı endüstrilerin genel olarak kabul ettiği belirli ölçümler vardır. Philomin, Bedrock’ta kıyaslama yapmanın amacının modelleri geniş bir şekilde değerlendirmek değil, şirketlere bir modelin projeleri üzerindeki etkisini ölçmenin bir yolunu sunmak olduğunu söyledi.



genel-2

Isro her gün 100’den fazla hackleme girişimiyle karşı karşıya; başkan S Somanath’a göre uzay ajansı bunları şu şekilde ele alıyor:
İhtiyaçlarınız için en iyi XPS 13 yapılandırmasını nasıl seçersiniz?
NASA, Ay Görevi İçin Uzay Aracı İnşa Etmek İçin Blue Origin ile Ortak Oldu
Harry Styles ‘My Policeman’ Filminde Eşcinsel Seks Sahnelerinde Gezinme Üzerine: “İhale, Sevecen ve Hassas”
Snapdragon 695 5G SoC, 64 Megapiksel Arka Kameralı Oppo Reno 8 Lite 5G Piyasaya Sürüldü: Fiyat, Özellikler
ETİKETLENDİ:AmazonEkipleriEtmekiçininsankıyaslamaModelleriniSunacaktest
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Destiny 2 Warlord’s Ruin Dungeon Çıkış Zamanı ve Bildiğimiz Her Şey
Sonraki Makale Dead by Daylight, ilk canon trans hayatta kalanını elde etti

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

RTX 5060’lı OLED Oyun Laptopu: 1.099 $ – HP Omen Transcend
Donanım
2026’nın En Kötü Siber Saldırıları ve Veri İhlalleri
Genel
OpenAI ve Anthropic’ten AI ile Biyolojik Silahlara Karşı Önlem Çağrısı
Genel
NZXT H6 Kasa ve Ultra RGB Fanlar: Sınırsız RGB Özelleştirme
Donanım
GitLab, AI Yüklerine Hizmet Vermek İçin Personelinin %14’ünü Kesiyor
Genel
CoD Sezon 4 Güncellemesi: SG-12 Dengeleme ve Anti-Hile Yenilikleri
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?