Openai transkripsiyonunu ve ses üreten AI modellerini yükseltiyor

Openai, şirketin önceki sürümlerinde geliştirdiğini iddia ettiği API’sine yeni transkripsiyon ve ses üreten AI modelleri getiriyor.

Openai için modeller daha geniş “ajan” vizyonuna uyuyor: kullanıcılar adına bağımsız olarak görevleri yerine getirebilen otomatik sistemler oluşturmak. “Ajan” tanımı tartışmalı olabilir, ancak Openai Ürün Başkanı Olivier Godement bir yorumu bir işletmenin müşterileriyle konuşabilen bir sohbet botu olarak tanımladı.

“Önümüzdeki aylarda daha fazla ajanın ortaya çıktığını göreceğiz” dedi Godement bir brifing sırasında TechCrunch’a. “Ve böylece genel tema, müşterilerin ve geliştiricilerin yararlı, mevcut ve doğru olan temsilcilerden yararlanmalarına yardımcı olmaktır.”

Openai, yeni metin-konuşma modeli “GPT-4O-Mini-TTS” in sadece daha nüanslı ve gerçekçi bir konuşma sunmakla kalmayıp aynı zamanda önceki nesil konuşma sentezleme modellerinden daha “yönlendirilebilir” olduğunu iddia ediyor. Geliştiriciler, GPT-4O-Mini-TTS’ye doğal dilde nasıl bir şey söyleneceği konusunda talimat verebilirler-örneğin, “çılgın bir bilim adamı gibi konuşun” veya “bir farkındalık öğretmeni gibi sakin bir ses kullanın”.

İşte “gerçek bir suç tarzı”, yıpranmış ses:

Openai transkripsiyon sonuçları — Openai transkripsiyon kıyaslamasından elde edilen sonuçlar.Resim Kredileri:Openai

Tm-En-2

Sanal Medya

Son Eklenenler

AMD B650 genişletme kartları $199’dan satışa sunuldu: 4 M.2 ve 11 USB portu ekleyin

Path of Exile 2 Oynamayı Bırakanlar İçin Şok Gelişme

4K Blu-ray’lerde Babalar Günü Öncesi Üç Tane 33 Dolar

Heyecan Verici Bir Yolculuk: God of War Laufey’in Yönetmeni Taraftarları Bekliyor

Dan Greaney’nin İlk Başkanlık Kampanya Mitingi: Şaka Değil!

$6000 kamyon oyun sistemine büyük güncelleme: Yeni koltuk ve aksesuarlar

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer