Google geçen hafta çeviri gözlüklerini alay etti Google I/O geliştirici konferansıbir gün yabancı dilde konuşan biriyle konuşabileceğinizin ve gözlüğünüzde İngilizce çevirisini görebileceğinizin sözünü vererek.
Şirket yöneticileri gözlükleri bir videoda gösterdi; sadece “altyazı” değil, aynı zamanda başka birinin söylediğini aynı dilde yazan gerçek zamanlı metin değil, aynı zamanda İngilizce ve Mandarin veya İspanyolca’ya çeviri yaparak, iki farklı dil konuşan kişilerin bir sohbeti sürdürmelerini sağladı. işitme engelli kullanıcıların başkalarının onlara ne söylediğini görmelerine izin vermek.
Google Çeviri donanımı olarak, gözlükler Google Çeviri’yi kullanırken büyük bir acı noktasını çözecektir: Sesli çeviri kullanıyorsanız, çeviri sesi gerçek zamanlı konuşmada adım atar. Çeviriyi görsel olarak sunarak konuşmaları çok daha kolay ve doğal bir şekilde takip edebilirsiniz.
Google Glass’ın aksine, çeviri gözlüğü prototipi de artırılmış gerçekliktir (AR). Ne demek istediğimi açıklayayım.
Artırılmış gerçeklik, bir cihaz dünyadan veri aldığında ve bu verinin ne anlama geldiğine bağlı olarak, kullanıcıya sunulan bilgileri ona eklediğinde gerçekleşir.
Google Glass artırılmış gerçeklik değildi – bir baş üstü ekranıydı. Başa çıkabileceği tek bağlamsal veya çevresel farkındalık konumdu. Konum bazında, adım adım yol tarifleri veya konuma dayalı hatırlatıcılar verebilir. Ancak normalde görsel veya işitsel verileri toplayamaz ve ardından gördükleri veya duyduklarıyla ilgili kullanıcı bilgilerine geri dönemezdi.
Google’ın çeviri gözlükleri, aslında, çevreden ses verilerini alarak ve kullanıcıya seçilen dilde söylenenlerin bir dökümünü geri göndererek AR’dir.
İzleyiciler ve teknoloji basını, anlayabildiğim kadarıyla, herhangi bir analitik veya eleştirel araştırma yapmadan çeviri işlevini bu gözlükler için özel bir uygulama olarak bildirdi. Her raporda belirtilmesi gereken en göze çarpan gerçek, çevirinin bulutta ses verilerini işlemek için yalnızca keyfi bir seçim olduğudur. Gözlüklerin yapabileceği daha çok şey var!
Herhangi bir uygulama için herhangi bir sesi kolayca işleyebilir ve kullanıcı tarafından tüketilecek herhangi bir metni veya herhangi bir sesi döndürebilirler. Bu açık değil mi?
Gerçekte, donanım buluta gürültü gönderir ve bulutun geri gönderdiği metni görüntüler. Gözlüklerin yaptığı tek şey bu. Gürültü gönder. Metni alın ve görüntüleyin.
Ses işleme ve eyleme dönüştürülebilir veya bilgilendirici bağlamsal bilgileri döndürme uygulamaları pratikte sınırsızdır. Gözlükler herhangi bir gürültü gönderebilir ve ardından uzak uygulamadan döndürülen herhangi bir metni görüntüleyebilir.
Gürültü, eski zamanlardaki bir modem gibi kodlanmış bile olabilir. Gürültü üreten bir cihaz veya akıllı telefon uygulaması, bulutta bir sesli QR kodu gibi işlenebilen R2D2 benzeri bipler ve ıslıklar gönderebilir ve sunucular tarafından yorumlandıktan sonra gözlüklerde görüntülenecek herhangi bir bilgiyi döndürebilir. Bu metin, ekipmanın çalıştırılması için talimatlar olabilir. Bir müzedeki belirli bir eser hakkında bilgi olabilir. Bir mağazadaki belirli bir ürün hakkında bilgi olabilir.
Bunlar, görsel AR’nin beş yıl veya daha uzun bir süre içinde teslim etmesini bekleyeceğimiz türden uygulamalar. Bu arada, çoğu sesle yapılabilir.
Google’ın “çeviri gözlükleri” için açıkça güçlü bir kullanım, onları Google Asistan ile kullanmak olacaktır. Google Asistan sorgularından normal ses verileriyle birlikte görsel veriler sağlayan bir ev cihazı olan Google Asistan ile akıllı bir ekran kullanmak gibi olurdu. Ancak bu görsel veriler, nerede olursanız olun, eller serbest olarak gözlüğünüzde mevcut olacaktır. (Bu, AR yerine bir baş üstü görüntüleme uygulaması olacaktır.)
Ancak “çeviri gözlüklerinin” bir akıllı telefonla eşleştirildiğini hayal edin. Başkaları tarafından verilen izinle, kişi verilerinin Bluetooth iletimleri, bir iş etkinliğinde kiminle konuştuğunuzu (gözlükte) ve ayrıca onlarla olan geçmişinizi gösterebilir.
Teknoloji basını neden Google Glass’ı kırdı?
Google Glass eleştirmenleri, esas olarak iki nedenden dolayı ürünü eleştirdi. İlk olarak, kulaklığa monte edilmiş öne bakan bir kamera insanları rahatsız etti. Bir Google Glass kullanıcısı ile konuşuyorsanız, kamera tam size doğrultulmuştu ve bu da kaydedilip kaydedilmediğinizi merak etmenize neden oluyordu. (Google, “çeviri gözlüklerinin” bir kamerası olup olmayacağını söylemedi, ancak prototipte kamera yoktu.)
İkincisi, aşırı ve göze çarpan donanım, kullanıcıları siborg gibi gösteriyordu.
Bu iki donanım ihlalinin birleşimi, eleştirmenlerin Google Glass’ın kibar bir şirkette sosyal olarak kabul edilemez olduğunu iddia etmesine yol açtı.
Öte yandan Google’ın “çeviri gözlükleri” ne bir kameraya sahipler ne de cyborg implantlarına benziyorlar – oldukça sıradan gözlüklere benziyorlar. Ve kullanıcının görebildiği metin, konuştuğu kişi tarafından görülemez. Sadece göz teması kuruyorlar gibi görünüyor.
Google’ın “çeviri gözlükleri” donanımı için geriye kalan tek toplumsal kabul edilemezlik noktası, Google’ın esasen başkalarının sözlerini izinsiz olarak “kaydetmesi”, bunları tercüme için buluta yüklemesi ve muhtemelen bu kayıtları diğerlerinde olduğu gibi saklaması gerçeğidir. sesle ilgili ürünler.
Yine de gerçek şu ki, yalnızca yapımcılar bu özelliği doğru ayarlayabilirlerse, artırılmış gerçeklik ve hatta baş üstü ekranlar bile süper çekicidir. Bir gün, sıradan görünümlü gözlüklerde tam görsel AR’ye sahip olacağız. Bu arada, doğru AR gözlükleri aşağıdaki özelliklere sahip olacaktır:
- Normal gözlüklere benziyorlar.
- Reçeteli lensleri kabul edebilirler.
- Kameraları yok.
- AI ile sesi işler ve metin yoluyla veri döndürürler.
- ve sonuçları metinle döndürerek yardımcı işlevi sunarlar.
Bugüne kadar böyle bir ürün yok. Ancak Google, bunu yapacak teknolojiye sahip olduğunu gösterdi.
Dilde altyazı ve çeviri en çekici özellik olsa da, diğer birçok çekici iş uygulaması için de yalnızca bir Truva Atı’dır – veya olmalıdır.
Google, “çeviri gözlüklerin” ne zaman – veya hatta – ticari bir ürün olarak gönderileceğini açıklamadı. Ancak bunları Google yapmazsa, bir başkası yapacak ve bu, iş kullanıcıları için öldürücü bir kategori olduğunu kanıtlayacaktır.
Sıradan gözlüklerin, kime ve ne duyduğuna ilişkin yapay zeka yorumlamasının görsel sonuçlarına ve yardımcı sorguların görsel ve işitsel sonuçlarına erişmenizi sağlama yeteneği, oyunun kurallarını tamamen değiştirecektir.
AR uygulamalarının ağırlıklı olarak akıllı telefon uygulamaları olarak var olduğu (bunların ait olmadığı yerlerde) teknolojinin gelişiminde garip bir dönemdeyiz; biz ise uzun yıllar sonra gelecek olan mobil, sosyal olarak kabul edilebilir AR gözlüklerini beklerken.
Bu arada çözüm açık: Sesi yakalayan ve kelimeleri görüntüleyen ses merkezli AR gözlüklerine ihtiyacımız var.
Bu sadece Google’ın gösterdiği şey.
Telif Hakkı © 2022 IDG Communications, Inc.