Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Sesi doğrudan dizüstü bilgisayarımda yazmak için OpenAI’nin yeni teknolojisini kullandım
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Sesi doğrudan dizüstü bilgisayarımda yazmak için OpenAI’nin yeni teknolojisini kullandım

Liste

Sesi doğrudan dizüstü bilgisayarımda yazmak için OpenAI’nin yeni teknolojisini kullandım

teknomers
Son güncelleme: 24 Eylül 2022 01:51
teknomers
Paylaş
Paylaş


Görüntü oluşturma ve meme oluşturma programı DALL-E’nin ve güçlü metin otomatik tamamlama motoru GPT-3’ün arkasındaki şirket olan OpenAI, sesi yazılı metne dönüştürmek için yeni, açık kaynaklı bir sinir ağı başlattı (aracılığıyla TechCrunch). Adı Fısıltı ve şirket diyor “İngilizce konuşma tanıma konusunda insan düzeyinde sağlamlığa ve doğruluğa yaklaşır” ve ayrıca İspanyolca, İtalyanca ve Japonca gibi diğer dilleri otomatik olarak tanıyabilir, yazıya dökebilir ve çevirebilir.

Röportajları sürekli kaydeden ve yazıya döken biri olarak, bu haber hakkında hemen heyecanlandım – sesi doğrudan bilgisayarımdan güvenli bir şekilde kopyalamak için kendi uygulamamı yazabileceğimi düşündüm. Otter.ai ve Trint gibi bulut tabanlı hizmetler çoğu şey için çalışıyor ve nispeten güvenli olsa da, ses dosyası internetten uzak durursa benim veya kaynaklarımın daha rahat hissedeceğim bazı röportajlar var.

Bunu kullanmak hayal ettiğimden daha kolay çıktı; Bilgisayarımda zaten Python ve çeşitli geliştirici araçları kurulu olduğundan, Whisper’ı yüklemek tek bir Terminal komutu çalıştırmak kadar kolaydı. 15 dakika içinde, kaydettiğim bir test ses klibini kopyalamak için Whisper’ı kullanabildim. Python, FFmpeg, Xcode ve Homebrew kurulumuna sahip olmayan nispeten teknoloji meraklısı biri için muhtemelen bir veya iki saate yakın sürer. Zaten süreci çok daha basit ve kullanıcı dostu hale getirmek için çalışan biri var, buna birazdan değineceğiz.

Komut satırı uygulamaları açıkçası herkes için değildir, ancak nispeten karmaşık bir iş yapan bir şey için Whisper'ın kullanımı çok kolaydır.

Komut satırı uygulamaları açıkçası herkes için değildir, ancak nispeten karmaşık bir iş yapan bir şey için Whisper’ın kullanımı çok kolaydır.

OpenAI iken kesinlikle bu kullanım durumunu bir olasılık olarak gördüm, şirketin bu sürümle temel olarak araştırmacıları ve geliştiricileri hedeflediği oldukça açık. İçinde Whisper’ı duyuran blog yazısı, ekip, kodunun “yararlı uygulamalar oluşturmak ve sağlam konuşma işleme konusunda daha fazla araştırma yapmak için bir temel olarak hizmet edebileceğini” ve “Whisper’ın yüksek doğruluğunun ve kullanım kolaylığının geliştiricilerin çok daha geniş bir ses arabirimi grubuna ses arabirimleri eklemesine olanak sağlayacağını umduğunu” söyledi. uygulamalar.” Ancak bu yaklaşım hala dikkate değerdir – şirketin DALL-E veya GPT-3 gibi en popüler makine öğrenimi projelerine sınırlı erişimi vardır. bir arzuyu belirtmek “gerçek dünya kullanımı hakkında daha fazla bilgi edinmek ve güvenlik sistemlerimizi yinelemeye devam etmek.”

Yung Gravy'nin “Betty (Get Money)” şarkısının sözlerinin yazıya döküldüğü bir metin dosyasını gösteren resim.  Transkripsiyon birçok yanlışlık içeriyor.Yung Gravy'nin “Betty (Get Money)” şarkısının sözlerinin yazıya döküldüğü bir metin dosyasını gösteren resim.  Transkripsiyon birçok yanlışlık içeriyor.

Whisper’ın ürettiği metin dosyaları, bunları bir makale yazmak için kullanıyorsanız, okunması en kolay olanlar değildir.

Ayrıca çoğu insan için Whisper’ı kurmanın tam olarak kullanıcı dostu bir süreç olmadığı gerçeği de var. Ancak gazeteci Peter Sterne, GitHub geliştirici savunucusu Christina Warren ile işbirliği yaptı. denemek ve bunu düzeltmek için, Whisper’ın makine öğrenimi modelini temel alan “gazeteciler için ücretsiz, güvenli ve kullanımı kolay bir transkripsiyon uygulaması” oluşturduklarını duyurdu. Sterne ile konuştum ve bazı röportajlar yaptıktan sonra Stage Whisper adlı programın var olması gerektiğine karar verdiğini ve bunun “insan transkripsiyoncular dışında şimdiye kadar kullandığım en iyi transkripsiyon” olduğuna karar verdiğini söyledi.

Whisper tarafından üretilen bir transkripsiyonu Otter.ai ve Trint’in aynı dosya için ortaya koyduklarıyla karşılaştırdım ve bunun nispeten karşılaştırılabilir olduğunu söyleyebilirim. Hepsinde, sesi iki kez kontrol etmeden asla alıntıları kopyalayıp bir makaleye yapıştırmayacağım kadar yeterli hata vardı (bu, elbette, hangi hizmeti kullanırsanız kullanın, yine de en iyi uygulamadır). Ama Whisper’ın versiyonu kesinlikle işime yarardı; İhtiyacım olan bölümleri bulmak için arama yapabilirim ve ardından bunları manuel olarak iki kez kontrol edebilirim. Teorik olarak, Stage Whisper aynı modeli kullanacağından, yalnızca etrafına sarılmış bir GUI ile tam olarak aynı performansı göstermelidir.

Sterne, Apple ve Google teknolojisinin birkaç yıl içinde Stage Whisper’ı geçersiz kılabileceğini itiraf etti – Pixel’in ses kaydedici uygulaması yıllardır çevrimdışı transkripsiyonlar yapabildi ve bu özelliğin bir sürümü kullanılmaya başlandı. diğer bazı Android cihazlara yaymakve Apple’ın yerleşik çevrimdışı dikte özelliği iOS (şu anda onunla ses dosyalarını kopyalamanın iyi bir yolu olmasa da). “Ama o kadar bekleyemeyiz,” dedi Sterne. “Bizim gibi gazetecilerin bugün iyi otomatik transkripsiyon uygulamalarına ihtiyacı var.” Fısıltı tabanlı uygulamanın çıplak kemik sürümünün iki hafta içinde hazır olmasını umuyor.

Açık olmak gerekirse, Whisper, kullanımı ne kadar kolay olursa olsun, muhtemelen Otter.ai ve Trint gibi bulut tabanlı hizmetleri tamamen eskimeyecek. Birincisi, OpenAI’nin modelinde geleneksel transkripsiyon hizmetlerinin en büyük özelliklerinden biri eksik: kimin ne söylediğini etiketleyebilme. Sterne, Stage Whisper’ın muhtemelen bu özelliği desteklemeyeceğini söyledi: “kendi makine öğrenimi modelimizi geliştirmiyoruz.”

Bulut sadece bir başkasının bilgisayarıdır – bu da muhtemelen biraz daha hızlı olduğu anlamına gelir

Yerel işlemenin avantajlarını elde ederken, dezavantajlarını da elde edersiniz. Bunlardan en önemlisi, dizüstü bilgisayarınızın profesyonel bir transkripsiyon hizmetinin kullandığı bilgisayarlardan neredeyse kesinlikle önemli ölçüde daha az güçlü olmasıdır. Örneğin, 24 dakikalık bir röportajın sesini M1 MacBook Pro’mda çalışan Whisper’a besledim; tüm dosyayı yazıya dökmek yaklaşık 52 dakika sürdü. (Evet, Intel yerine Python’un Apple Silicon sürümünü kullandığından emin oldum.) Otter, sekiz dakikadan daha kısa bir sürede bir metin tükürdü.

OpenAI’nin teknolojisinin büyük bir avantajı var – fiyat. Bulut tabanlı abonelik hizmetleri, bunları profesyonelce kullanıyorsanız neredeyse kesinlikle size pahalıya mal olacaktır (Otter’ın ücretsiz bir katmanı vardır, ancak yakında yapılacak değişiklikler, işleri sık sık yazıya döken insanlar için daha az kullanışlı hale getirecektir) ve yerleşik transkripsiyon özellikleri -gibi platformlara Microsoft Word veya Pixel, ayrı yazılım veya donanım için ödeme yapmanızı gerektirir. Stage Whisper – ve Whisper’ın kendisi – ücretsizdir ve sahip olduğunuz bilgisayarda çalışabilir.

Yine, OpenAI, Whisper için güvenli bir transkripsiyon uygulamasının temeli olmaktan daha yüksek umutlara sahip – ve araştırmacıların bununla ne yapacakları veya eğitilmiş makine öğrenimi modeline bakarak ne öğrenecekleri konusunda çok heyecanlıyım. “Web’den toplanan 680.000 saat çok dilli ve çok görevli denetimli veri” üzerine. Ancak günümüzde gerçek ve pratik bir kullanıma sahip olması onu daha da heyecanlı kılıyor.



genel-2

Best Buy’da Bose gürültü önleyici kulaklık ve kulak içi kulaklıklardan tasarruf edin
Oppo F27 Pro+ 5G Özeti: Lansman Tarihi, Hindistan’da Beklenen Fiyat, Özellikler, Teknik Özellikler ve Daha Fazlası
ThisChatbot, Comcast Desteğiyle Savaşacak
Bu çılgın Siber Pazartesi hepsi bir arada fırsatından yararlanmak için zaman neredeyse doldu — 27 inç dokunmatik ekran, hoparlörler ve yerleşik web kamerasıyla başka bir şey satın almanıza gerek kalmayacak
ABD, yerel çip üretimini artırmak için Samsung’a 6,4 milyar dolar bağışladı – Computerworld
ETİKETLENDİ:bilgisayarımdaDizüstüdoğrudaniçinkullandımOpenAIninSesiteknolojisiniYazmakYeni
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale İngiltere teknolojisi için mini bütçe ne anlama geliyor – UKTN
Sonraki Makale Allan Thygesen, DocuSign’ın CEO’su olarak atandı

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Elegoo Jupiter 2 Reçineli 3D Yazıcı İncelemesi: Dev Geri Döndü
Donanım
Yeni Spyro Oyunu: A Realm Beyond ile Efsane Yeniden Canlanıyor
Oyun
NASA Ay’a Yüksek Teknoloji Prada Termal Giysileriyle Gidecek
Liste
Çin, Saishiteng Dağı’nı Dünyanın En Büyük Astronomi Üssü Yapıyor!
Bilim
2026 Dünya Kupası İskoçya, Finallerde Fark Yaratmaya Hazır mı?
Spor
Spyro Geliştiricileri Uçuş Mekaniğini Yalnızca Iron Man ile Karşılaştırıyor
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?