Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: MLCommons ve Hugging Face Team, AI araştırması için büyük konuşma veri seti yayınlamak için
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » MLCommons ve Hugging Face Team, AI araştırması için büyük konuşma veri seti yayınlamak için

Liste

MLCommons ve Hugging Face Team, AI araştırması için büyük konuşma veri seti yayınlamak için

teknomers
Son güncelleme: 1 Şubat 2025 01:11
teknomers
Paylaş
Paylaş


Kâr amacı gütmeyen bir AI Güvenlik Çalışma Grubu olan MLCommons, AI araştırması için dünyanın en büyük kamu malı ses kayıtlarından birini yayınlamak için AI Dev Platform Hugging Face ile birlikte çalıştı.

Veri seti, Denetimsiz insanların konuşmasıen az 89 farklı dili kapsayan bir milyon saatten fazla ses içerir. MLCommons, “konuşma teknolojisinin çeşitli alanlarında” Ar -Ge’yi destekleme arzusuyla yaratmanın motive olduğunu söyledi.

Organizasyon, “İngilizce dışındaki diller için daha geniş doğal dil işleme araştırmalarını desteklemek, küresel olarak daha fazla insana iletişim teknolojilerini getirmeye yardımcı oluyor” diye yazdı. Blog yazısı Perşembe. “Araştırma topluluğunun, özellikle düşük kaynaklı dil konuşma modellerini iyileştirme, farklı aksanlar ve lehçelerde konuşma tanıma ve konuşma sentezindeki yeni uygulamalarda gelişmeye devam etmesi ve geliştirmeye devam etmesi için çeşitli yollar bekliyoruz.”

Emin olmak takdire şayan bir hedef. Ancak denetimsiz insanların konuşması gibi AI veri setleri, bunları kullanmayı seçen araştırmacılar için risk taşıyabilir.

Önyargılı veriler bu risklerden biridir. Denetimsiz insanların konuşmasındaki kayıtlar, belki de en iyi Wayback Machine Web Arşiv aracı ile bilinen kâr amacı gütmeyen Archive.org’dan geldi. Archive.org’un katkıda bulunanlarının çoğu İngilizce konuşan-ve Amerikan-denetimsiz insanların konuşmalarındaki kayıtların neredeyse tamamı Amerikan aksanlı İngilizce’de. Resmi Proje sayfasındaki ReadMe’ye göre.

Bu, dikkatli bir filtreleme olmadan, denetimsiz insanların konuşması üzerine eğitilmiş konuşma tanıma ve ses sentezleyici modelleri gibi AI sistemlerinin aynı önyargılardan bazılarını sergileyebileceği anlamına gelir. Örneğin, anadili olmayan bir konuşmacı tarafından konuşulan İngilizceyi kopyalamak veya İngilizce dışındaki dillerde sentetik sesler üretmekte zorluk çekebilirler.

Denetimsiz insanların konuşması, seslerinin ticari uygulamalar da dahil olmak üzere AI araştırma amaçları için kullanıldığını bilmeden insanlardan gelen kayıtlar içerebilir. MLCommons, veri kümesindeki tüm kayıtların kamu malı olduğunu veya Creative Commons lisansları altında mevcut olduğunu söylerken, olasılık hataları yapıldı.

Bir MIT analizine göreYüzlerce halka açık AI eğitim veri setleri lisans bilgisi yoktur ve hatalar içerir. AI Etik odaklı kâr amacı gütmeyen kuruluşun CEO’su Ed Newton-Rex de dahil olmak üzere Yaratıcı savunucuları, yaratıcıların bu içerik oluşturucuları seçen zahmetli yükler nedeniyle AI veri setlerini “devre dışı bırakması” gerekmemesi gerektiğine dair dava açtı. .

“Birçok yaratıcının (örneğin Squarespace kullanıcıları) anlamlı bir yol yok,” Newton-Rex yazdı Geçen Haziran ayında X’teki bir yazıda. “Yaratıcılar için olabilmek Çıkış, (1) inanılmaz derecede kafa karıştırıcı ve (2) kapsamlarında acımasızca eksik olan birden fazla örtüşen devre dışı bırakma yöntemi vardır. Mükemmel bir evrensel devre dışı bırakma olsa bile, üretken AI’nın çalışmalarını onlarla rekabet etmek için kullandığı göz önüne alındığında, birçoğu dışarıda kalabileceklerini fark etmeyecekti. ”

MLCommons, denetimsiz insanların konuşmasının kalitesini güncellemeye, sürdürmeye ve iyileştirmeye kararlı olduğunu söylüyor. Ancak potansiyel kusurlar göz önüne alındığında, geliştiricileri ciddi bir dikkat göstermeye yönlendirir.



genel-24

Vivo şimdi de Alman pazarına veda mı ediyor?
Android’in AirDrop’a Cevabı Beta Olarak Denenebilir
Meta, Lama modellerini ABD ulusal güvenlik uygulamaları için kullanıma sunduğunu söylüyor
Tüketici finansmanı uygulaması Djamo, 14 milyon dolarlık yeni turla desteklenen Frankofon Afrika genişlemesini hedefliyor
Dial of Destiny Macera ve Kalp Sunar
ETİKETLENDİ:Açık kaynakAIAraştırmasıbüyükFaceHuggingiçinKamu malıkonuşmamlcommonsön yargıSarılma YüzüsetiTeamüretken yapay zekaVeriveri kümesiYayınlamak
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Killing Floor 3 set lansman tarihi ve kapalı bir beta testine kaydolabilirsiniz
Sonraki Makale Apple’ın AR video gözlük projesinden vazgeçtiği bildirildi

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Arc Raiders’ın Karanlık Yüzü: Unutulmaz Bir Deneyim Sizi Bekliyor
Oyun
Robotaksi Savaşı: Uber, Wayve ve Waymo Londra’da Karşılaşıyor
Genel
WWDC 2026’da Neler Olacak ve Nasıl İzlenir?
Liste
Acil: VerdantBamboo, Linux Cihazlarında BSD Tabanlı BRICKSTORM’u Yayınladı
Siber Güvenlik
Afroman Döndü: Bitcoin’le Özgürlük Mücadelesi Veriyor!
Genel
Gears Of War Tasarımcısından E-Day Hakkında Çarpıcı Yorumlar
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?