La voz IA de una startup china engaña al 66% de los oyentes, y es una señal de alarma

La Voz IA de una Startup China: Un Riesgo Alarmante

Contextualizando el 66%

El sorprendente dato de que el 66% de los oyentes no identifica una voz sintética como artificial no surge de un experimento controlado en un laboratorio. Este porcentaje representa a personas comunes expuestas a voces generadas por inteligencia artificial en situaciones cotidianas de escucha. Esta estadística resalta la efectividad de la tecnología actual y, a la vez, plantea serias preocupaciones sobre los riesgos asociados.

Un Mecanismo de Rechazo

La investigación revela que, en el momento en que un oyente percibe que una voz es artificial, tiende a rechazarla de inmediato. Este fenómeno pone de manifiesto la necesidad de que los modelos de voz mejoren en aspectos vitales como la percepción humana, la confianza, la autoridad y la sutileza emocional. Nick Lahoika, fundador de Vocal Image, destaca que muchos modelos desarrollados por grandes empresas tecnológicas se centran en el volumen y la funcionalidad general, como la lectura de informes meteorológicos, pero fallan al abordar contextos que requieren una mayor precisión y matices.

El Último Kilómetro de la Calidad Vocal

Uno de los aspectos más críticos es lo que Lahoika denomina el “último kilómetro” de la calidad vocal. Este término se refiere a elementos como la correcta pronunciación de números, las inflexiones contextuales y los silencios significativos. Estos detalles, a menudo sacrificados en favor de la escalabilidad, son esenciales para que una voz sintética se perciba como verdadera y fiable.

Un Problema en Aumento: Fraudes y Usurpación

El problema de las voces sintéticas va más allá de la simple experiencia de escucha. En los últimos años, el número de reportes relacionados con la usurpación de números telefónicos ha crecido exponencialmente, pasando de 531 informes en 2023 a más de 19,000 en 2025. Esta tendencia ha convertido la usurpación de identidad en la principal razón de los reclamos ante la Autoridad Reguladora de Comunicaciones (Arcep).

Los estafadores están utilizando voces sintéticas que imitan a representantes de bancos o autoridades públicas para dar credibilidad a sus llamadas. Esta técnica ha demostrado ser alarmantemente efectiva, lo cual ha llevado a Arcep a iniciar una investigación administrativa a partir del 29 de enero de 2026. La intención es verificar si los operadores están cumpliendo con las obligaciones de autenticación de números de llamada.

Una Doble Cara de la Tecnología

Es irónico que el avance tecnológico que permite a una startup producir voces indistinguibles de las humanas, accesibles mediante API a un costo mínimo, no sea motivo de celebración. En realidad, se ha convertido en una herramienta más para los defraudadores. Este desarrollo pone de relieve la necesidad urgente de mejorar la regulación y las medidas de seguridad en el uso de la inteligencia artificial.

Conclusiones

El avance en la generación de voces IA es impresionante, pero su potencial para ser mal utilizado representa una amenaza significativa. Los responsables de la regulación deben actuar rápidamente para proteger a los consumidores de los nuevos riesgos que surgen con estas tecnologías. La evolución de la voz sintética debe ir acompañada de una fuerte ética y responsabilidad social para evitar que se convierta en un vehículo para el fraude y la desinformación.

General