Microsoft Ignite 2023 etkinliğinde piyasaya sürülecek en beklenmedik ürünlerden biri, bir kişinin fotogerçekçi bir avatarını oluşturabilen ve bu avatarın, kişinin mutlaka söylemediği şeyleri söylemesini canlandırabilen bir araçtır.

Azure AI Konuşma metninden konuşmaya avatar olarak adlandırılan ve bugün itibarıyla genel önizlemeye sunulan yeni özellik, kullanıcıların, avatarın benzemesini istedikleri bir kişinin resimlerini yükleyerek ve bir komut dosyası yazarak konuşan bir avatarın videoları oluşturmasına olanak tanıyor. Microsoft’un aracı, animasyonu yürütmek için bir modeli eğitirken, önceden oluşturulmuş veya kişinin sesiyle eğitilmiş ayrı bir metinden konuşmaya modeli, senaryoyu yüksek sesle “okur”.

“Kullanıcılar, metinden konuşmaya avatarla daha verimli bir şekilde video oluşturabilir… eğitim videoları, ürün tanıtımları, müşteri referansları oluşturabilirler [and so on] sadece metin girişiyle” Microsoft bir blog yazısında yazıyor. “Avatar’ı konuşma aracıları, sanal asistanlar, sohbet robotları ve daha fazlasını oluşturmak için kullanabilirsiniz.”

Avatarlar birden fazla dilde konuşabilir. Ayrıca sohbet robotu senaryolarında müşterilerden gelen senaryo dışı sorulara yanıt vermek için OpenAI’nin GPT-3.5’i gibi yapay zeka modellerinden faydalanabilirler.

Artık böyle bir aracın kötüye kullanılmasının sayısız yolu var; Microsoft da bunun farkında. (Yapay zeka girişimi Synthesia’nın benzer avatar oluşturma teknolojisi, kötüye kullanılmış Venezuela’da propaganda üretmek ve YANLIŞ Çin yanlısı sosyal medya hesapları tarafından tanıtılan haber raporları.) Çoğu Azure abonesi, lansman sırasında yalnızca önceden oluşturulmuş (özel değil) avatarlara erişebilecek; Microsoft, özel avatarların şu anda yalnızca kayıt yoluyla ve “yalnızca belirli kullanım durumları için” kullanılabilen “sınırlı erişim” özelliği olduğunu söylüyor.

Ancak bu özellik bir dizi rahatsız edici etik soruyu gündeme getiriyor.

Son SAG-AFTRA grevindeki en önemli anlaşmazlık noktalarından biri, dijital benzerlikler oluşturmak için yapay zekanın kullanılmasıydı. Stüdyolar sonunda oyunculara yapay zeka tarafından oluşturulan benzerlikler için ödeme yapmayı kabul etti. Peki ya Microsoft ve müşterileri?

Microsoft’a, aktörlerin görüşlerine göre uygun bir tazminat ve hatta bildirimde bulunulmadan, aktörlerin benzerlerini kullanan şirketler hakkındaki tutumunu sordum. Şirket yanıt vermedi ve şirketlerin avatarları yapay zeka tarafından üretilmiş olarak etiketlemesinin gerekip gerekmeyeceğini söylemedi. Youtube ve bir büyüyen numara diğer platformlardan.

Kişisel ses

Microsoft’un, aynı zamanda Ignite’ta piyasaya sürülen ilgili bir üretken yapay zeka aracı olan kişisel ses etrafında daha fazla korkuluğa sahip olduğu görülüyor.

Microsoft’un özel sinirsel ses hizmetindeki yeni bir yetenek olan kişisel ses, bir dakikalık konuşma örneğini sesli komut olarak sağlayarak kullanıcının sesini birkaç saniye içinde kopyalayabilir. Microsoft bunu kişiselleştirilmiş sesli asistanlar oluşturmanın, içeriği farklı dillere kopyalamanın ve hikayeler, sesli kitaplar ve podcast’ler için özel anlatımlar oluşturmanın bir yolu olarak sunuyor.

Olası hukuki sıkıntıları ortadan kaldırmak için Microsoft, bir müşterinin kendi sesini sentezlemek için kişisel sesini kullanabilmesi için kullanıcıların kayıtlı bir beyan şeklinde “açık izin” vermesini şart koşuyor. Bu özelliğe erişim şimdilik bir kayıt formuyla sağlanıyor ve müşterilerin kişisel seslerini yalnızca “ses kullanıcı tarafından oluşturulan veya açık uçlu içeriği okumadığı” uygulamalarda kullanmayı kabul etmeleri gerekiyor.

Microsoft, bir blog yazısında “Ses modeli kullanımı bir uygulama içinde kalmalı ve çıktı, uygulamadan yayınlanamaz veya paylaşılamaz olmalıdır” diye yazıyor. “[C]Sınırlı erişim uygunluk kriterlerini karşılayan kullanıcılar, ses modellerinin ve bunların çıktılarının oluşturulması, bunlara erişim ve bunların kullanımı üzerinde tek kontrole sahip olurlar. [where it concerns] Yalnızca eğlence senaryoları için film, TV, video ve ses dublajı.”

Microsoft, TechCrunch’ın aktörlerin kişisel ses katkılarının karşılığını nasıl alabilecekleri ya da yapay zeka tarafından üretilen seslerin daha kolay tanımlanabilmesi için herhangi bir filigran teknolojisi uygulamayı planlayıp planlamadığı hakkındaki sorularını yanıtlamadı.

Daha fazla Microsoft Ignite 2023 kapsamı için:

Bu hikaye ilk olarak 15 Kasım sabah saat 8’de (PT) yayınlandı ve saat 15:30’da (PT) güncellendi.



genel-24