Google Dokümanlar, yakında sesle yazma özelliğini toplantıları yazıya dökmek için çok daha kullanışlı ve popüler hale getirebilecek büyük bir güncelleme alıyor.

Bulut kelime işlemcisi, birkaç yıldır eller serbest olarak sesinizle ‘yazma’ olanağı sunuyor (mikrofonunuz açıkken Araçlar > Sesle yazma’ya gitmeniz yeterli). Ancak Şubat ayının başlarında gelecek olan bir güncelleme, özellikte bazı iyileştirmeler ve ayrıca özelliği Chrome dışındaki web tarayıcılarında kullanma seçeneği görecek.

Google, yükseltmenin “transkripsiyon hatalarını azaltmaya ve transkripsiyon sırasında ses kaybını en aza indirmeye yardımcı olacağını” söylüyor. Mevcut enkarnasyonun sınırlamaları, TechRadar ekibi tarafından yaygın olarak kullanılan Otter.ai gibi en iyi konuşmadan metne uygulamalara zemin kaybettiğini gördü. Microsoft’un konuşma tanıma ve erişilebilirlik araçları da son zamanlarda Word gibi uygulamalarda büyük atılımlar yaptı.

Ancak Google Dokümanlar’ın yerleşik eşdeğeri, giderek daha etkileyici hale gelen rakiplerinin doğruluğuyla eşleşebilirse, çok daha yaygın kullanılan bir araç haline gelebilir. Özellikle, bir konuşmacının sözlerini gerçek zamanlı olarak görüntülemek için Google Slaytlar’da da çalışacağı için.

Özellik ayrıca başka bir yükseltme sayesinde gelişmeye devam etmelidir; desteği “en büyük tarayıcılara” genişletti. Google henüz hangi tarayıcıları söylemedi, ancak Safari, Firefox ve Microsoft Edge’in dahil edilebileceğini söylemek güvenli.

Muhtemelen önümüzdeki ay güncellemenin ne zaman kullanıma sunulacağını öğreneceğiz. Hızlı Sürüm güncellemelerine abone olan Google Workspace kullanıcıları, güncellemenin bugünden itibaren geldiğini görmeye başlayacak, ancak çoğumuz 6 Şubat’tan itibaren iki hafta içinde kademeli olarak kullanıma sunacağız.


Analiz: AI yararlı olmayı öğrenir

Google, Google Dokümanlar’daki sesle yazma yükseltmesine hangi teknolojinin güç verdiği konusunda açık bir açıklama yapmadı, ancak işletmelere müşteri etkileşimleri gibi hizmetleri iyileştirme teklifinde bulunuyorsa, muhtemelen yapay zeka tabanlı arayüze benziyor.

AI teknolojisi, ChatGPT gibi sohbet robotlarının yanı sıra Dall-E ve Midjourney gibi görsel alanda hızla gelişiyor. El yazısı tanımaya da büyük bir destek verildiği görüldü. Ancak konuşma, hem kullanılabilirlik hem de erişilebilirlik açısından yapay zeka gelişimi için tartışmasız en yararlı alanlardan biridir. Ve güvenilir konuşmayı metne dönüştürme yazılımı sadece başlangıçtır.

Microsoft kısa bir süre önce Vall-E adlı tüyler ürpertici ama potansiyel olarak faydalı yeni bir yapay zeka teknolojisini tanıttı. insan seslerini taklit etmek (yeni sekmede açılır) yalnızca üç saniyelik bir örneğe dayalıdır. Benzer bir tema üzerine, Apple kısa süre önce yapay zeka destekli anlatıcılara sahip ilk sesli kitap serisini piyasaya sürdü (yukarıda).

Bu ilerlemeler, kimliğe bürünme potansiyeli hakkında çok büyük etik soruları gündeme getiriyor, bu nedenle her ikisinin de arkasındaki teknoloji şu anda kilitli ve tüketiciler tarafından kullanılamıyor. Ancak bir pandora’nın ses tabanlı teknoloji kutusu dramatik bir şekilde açıldı.

Şimdilik, Google Docs (ve aslında en iyi metinden konuşmaya yazılımı) benzerlerinde bulunan konuşmadan metne teknolojisindeki hızlı gelişmeler, bu yeni AI algoritmalarının en yararlı meyveleridir. O yazılım toplantı notlarımızı alırken biz de yeni nesil ses taklitçileri hakkındaki kaçınılmaz etik tartışmalar için patlamış mısırları kapıyor olacağız.





genel-6