PaLM 2’nin yapay zeka yeteneklerini Bard da dahil olmak üzere Google ekosistemine sorunsuz bir şekilde entegre etmek, Google G/Ç 2023 etkinlik. Google, anında yayınlanmaması gereken bazı özellikler olduğuna inansa da.
Google I/O açılış konuşması sırasında, şirketin teknoloji ve toplumdan sorumlu kıdemli başkan yardımcısı James Manyika, yanlış bilgilendirme ile bazı yapay zeka yetenekleri, yani derin sahtekarlıkların arkasındaki teknoloji arasındaki potansiyel gerilimler hakkında endişelerini dile getirdi.
Bahsettiği şey, deepfake’lerin videolardaki sesleri dublajlamak için kullandıkları dil modelleridir – ünlü bir aktörün en iyi TV şovlarından veya en iyi filmlerden birindeki monologunun aniden dudak senkronizasyonu için değiştirildiği modelleri bilirsiniz.
Sonuç olarak Google, fotoğraflarda ve videolarda filigranlar ve meta veriler gibi eserler bırakarak bu yeni özelliklerden bazılarının kötüye kullanılmasını önlemek için “korkuluk” olarak adlandırdığı şeyi kurmak için bazı adımlar atıyor. Son derece yararlı ve yararlı olacak, ancak kolayca kötüye kullanılabilecek yeni bir araç, Google’ın belirli sayıda iş ortağına sunduğu “evrensel çevirmen” adı verilen bir prototiptir.
Google’ın evrensel çevirmeni, konuşmayı gerçek zamanlı olarak çeviren deneysel bir yapay zeka video dublaj hizmetidir ve bir video izlerken birinin başka bir dilde söylediklerini anında okumanıza olanak tanır. Prototip, etkinlik sırasında sergilendi ve Arizona Eyalet Üniversitesi ile ortaklaşa oluşturulan çevrimiçi bir üniversite kursunun parçası olan bir testten videolar ortaya çıktı.
Model dört aşamada çalışmaktadır. İlk aşamada model, bir videodaki dudak hareketlerini tanıdığı kelimelerle eşleştiriyor. İkinci adım, anında konuşma üretimi sağlayan bir algoritmayı tetikler.
Modelin üçüncü aşaması, çeviriye yardımcı olmak için konuşan birinin doğal hızında artış ve düşüşü ölçen tonlamayı kullanır. Son olarak, stili kopyaladıktan ve konuşmacının dudak hareketlerinin tonunu eşleştirdikten sonra, çeviriyi oluşturmak için hepsini bir araya getirir.
Google, erken sonuçların umut verici olduğunu söylüyor. Üniversite öğrencilerinin ders oranlarında daha yüksek tamamlama sayısı gösteren çalışma.
Evrensel çevirmen nerede yer alacak?
Evrensel çevirmen özelliği henüz küçük bir beta test grubu dışında mevcut olmasa da, Google çok sayıda korumayı test ettikten sonra, örneğin YouTube ve video konferans hizmeti Google Meet gibi hizmetlerde kullanıma sunabilir.
Ne de olsa, canlı videoları gerçek zamanlı olarak birden fazla dile çevirebilmek inanılmaz derecede yararlı bir araç olabilir. Evrensel bir çevirmen, yalnızca bir YouTube kanalının küresel izleyici kitlesini genişletmekle kalmaz, aynı zamanda ülkeler arasında daha fazla ortak çalışmaya olanak tanır.
Bu özelliği ve Google ekosisteminde nerelerde kullanılabileceğini kesinlikle izliyor ve daha fazlasını duymayı bekliyor olacağız.
Google I/O’dan en büyük haberler hakkında daha fazlasını mı arıyorsunuz? Etkinlikte duyurulanların tek tek özetini almak için Google I/O 2023 canlı blogumuza göz atın.