Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Microsoft, 3 Saniyelik İstemlerden Herhangi Bir Sesi Simüle Eden Ses Yapay Zekası VALL-E’yi Tanıttı
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Microsoft, 3 Saniyelik İstemlerden Herhangi Bir Sesi Simüle Eden Ses Yapay Zekası VALL-E’yi Tanıttı

Liste

Microsoft, 3 Saniyelik İstemlerden Herhangi Bir Sesi Simüle Eden Ses Yapay Zekası VALL-E’yi Tanıttı

teknomers
Son güncelleme: 10 Ocak 2023 21:27
teknomers
Paylaş
Paylaş


Microsoft araştırmacıları kısa bir süre önce, üç saniyelik bir ses örneği verildiğinde bir kişinin sesini doğru bir şekilde taklit edebilen yeni bir metinden konuşmaya yapay zeka modeli olan VALL-E’yi duyurdu. VALL-E, belirli bir sesi öğrendiğinde, konuşmacının duygusal tonunu korumaya çalışırken, herhangi bir şey söyleyen kişinin sesini sentezleyebilir. VALL-E’nin yaratıcıları, GPT-3 gibi diğer üretken AI modelleriyle birleştirildiğinde, yüksek kaliteli metin okuma uygulamaları, bir kişinin kaydının düzenlenebildiği ve bir metin dökümünden değiştirilebildiği konuşma düzenleme için kullanılabileceğine inanıyor. (aslında söylemedikleri bir şeyi söylemelerini sağlamak) ve sesli içerik oluşturma.

Microsoft’a göre, VALL-E öncelikle bir “nöral codec dil modeli”dir ve Meta’nın Ekim 2022’de kullanıma sunduğu EnCodec’e dayanır. dalga biçimlerinin manipüle edilmesi. Bir kişinin nasıl ses çıkardığını işler, EnCodec’i kullanarak ilgili verileri ayrı bileşenlere (“belirteçler” olarak adlandırılır) ayırır ve ardından, o sesin ötesinde başka ifadeler söylerse nasıl ses çıkarabileceğine ilişkin “bildiğini” eşleştirmek için eğitim verilerini kullanır. üç saniyelik örnek.

Microsoft, Meta’nın LibriLight ses kitaplığını kullanarak VALL-E’nin konuşma sentezi işlevlerini eğitti. Öncelikle LibriVox kamuya açık sesli kitaplardan alınan 7.000’den fazla konuşmacının 60.000 saatlik İngilizce konuşmasını içerir. VALL-E’nin iyi bir sonuç vermesi için üç saniyelik örnekteki sesin öğrenme algoritmasındaki bir sese çok benzemesi gerekir.

Amerikan teknoloji devi, yapay zeka modelinin iş başında olduğu düzinelerce sesli örnek sunuyor. VALL-E örnek web sitesi. “Konuşmacı İstemi” veri seti, taklit etmeye çalışması gereken VALL-E’ye verilen üç saniyelik sestir. “Yer Gerçeği”, aynı konuşmacının karşılaştırma amacıyla belirli bir cümleyi söyleyen önceden kaydedilmiş bir versiyonudur (deneydeki “kontrol” gibi). “Temel” örneği, geleneksel bir metinden konuşmaya sentez yöntemiyle üretilir ve “VALL-E” örneği, VALL-E modeli tarafından oluşturulur.

Microsoft VALL E blok şeması Microsoft VALL-E Microsoft

Microsoft araştırmacıları tarafından örnek web sitesinde gösterildiği gibi bir VALL-E blok diyagramı
Fotoğraf Kredisi: Microsoft

Araştırmacılar, bu sonuçları elde etmek için yalnızca üç saniyelik “Konuşmacı İstemi” örneğini ve bir metin dizisini (sesin söylemesini istedikleri şeyi) VALL-E’ye sağladılar. Bazı VALL-E sonuçları bilgisayar tarafından oluşturulmuş gibi görünür, ancak diğerleri, modelin amacı olan insan konuşması nedeniyle yanlış anlaşılabilir. VALL-E’nin suçları ve aldatmacayı körükleme potansiyeli nedeniyle Microsoft, VALL-E kodunu başkalarının keşfetmesi için kullanılabilir hale getirmedi. Araştırmacılar, bu teknolojinin neden olabileceği potansiyel sosyal zararın farkında gibi görünüyor.

Makalenin sonuç bölümünde şöyle yazıyorlar: “VALL-E, konuşmacı kimliğini koruyan konuşmayı sentezleyebildiğinden, modelin kötüye kullanılması durumunda, ses kimliğinin sahtekarlığı veya belirli bir konuşmacının kimliğine bürünme gibi potansiyel riskler taşıyabilir. Bu tür riskleri azaltmak mümkündür. bir ses klibinin VALL-E tarafından sentezlenip sentezlenmediğini ayırt etmek için bir algılama modeli oluşturmak. Modelleri daha da geliştirirken Microsoft AI İlkelerini de uygulamaya koyacağız.”


Ortaklık bağlantıları otomatik olarak oluşturulabilir – ayrıntılar için etik beyanımıza bakın.

CES 2023 merkezimizde Gadgets 360 ile ilgili Tüketici Elektroniği Şovundan en son haberleri alın.

Poco C55’in Yeniden Markalanmış Bir Redmi 12C Olacağı Belirtildi, Yakında Piyasaya Sürülmesi Bekleniyor

Günün öne çıkan videosu

Disney+ Hotstar Ocak 2023: Sonumuz, Taaza Khabar ve daha fazlası!



genel-8

iPhone’daki Opera One Tarayıcısı, Yapay Zeka Görüntü Oluşturma Yetenekleri ve Daha Fazlasıyla Büyük Bir Yeniliğe Kavuşuyor
Dragon Age: The Veilguard oyun yönetmeni DLC ve genişlemelerden bahsediyor
Meta’nın AI’sı Instagram Hesaplarını Ele Geçirmek İçin Kötüye Kullanıldı
En iyi Kara Cuma fırsatları: LG OLED TV’ler, iPad Mini ve Roku Streaming Stick 4K
Bir akıllı telefondan ne kadar altın çıkarılabilir? Kullanıcı, bu sorunun cevabını bulmak için 200’den fazla cihazı yeniden tasarladı
ETİKETLENDİ:#microsoftBiredenherhangiİstemlerdenmicrosoft val e audio ai ses vall-e simülasyonunu ortaya çıkarırsaniyelikSesSesisimüleTanıttıValleyiYapayzekası
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Birleşik Krallık için uydu fırlatma yarışında ilk başarısızlık
Sonraki Makale Akıllı telefonunuzda kullanılan veri hacmini kontrol edin

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Gears Of War: E-Day ile Testere Lancer’ın Hikayesi Keşfediliyor
Oyun
Gears Of War’ta Devrim Niteliğinde Hareket Yeniliği
Oyun
Acil: Yapay Zeka Destekli Windows Terminal ile Tanışın!
Siber Güvenlik
Elegoo Jupiter 2 Reçineli 3D Yazıcı İncelemesi: Dev Geri Döndü
Donanım
Yeni Spyro Oyunu: A Realm Beyond ile Efsane Yeniden Canlanıyor
Oyun
NASA Ay’a Yüksek Teknoloji Prada Termal Giysileriyle Gidecek
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?