Skip to main content

¿Qué es el análisis de voz?

La analítica del habla es una técnica computarizada que se utiliza para analizar el contenido del habla. No es simplemente una herramienta de conversión de voz a tecnología. En cambio, está diseñado para detectar patrones en el habla, incluidos el contenido y el tono.

El uso más simple de la analítica del habla es medir con qué frecuencia se usan frases particulares. Antes del análisis del habla, esto solo era posible transcribiendo una grabación y luego usando una computadora o búsqueda manual para buscar frases particulares. Con el análisis del habla, un sistema informático puede preprogramarse para "escuchar" una palabra en particular e incluso puede producir información en tiempo real.

Hay múltiples usos para tal tecnología. Una empresa con un centro de llamadas podría analizar las conversaciones que el personal tiene con los clientes para detectar patrones en las quejas. Por ejemplo, mientras que los registros de llamadas pueden mostrar que un producto en particular causa muchas quejas o consultas, el análisis de voz puede mostrar que un aspecto particular del producto, como una línea en las instrucciones, se menciona con frecuencia. Una autoridad de aplicación de la ley o un servicio de seguridad podría analizar las llamadas telefónicas que supervisa para ver si los sospechosos mencionan una frase en particular.

Se pueden utilizar análisis de voz más sofisticados para analizar el tono e incluso el contexto. Por ejemplo, una compañía de telemarketing generalmente hará un seguimiento del porcentaje de llamadas que realiza que resulten en una venta, pero no necesariamente tendrá estadísticas que muestren por qué las personas rechazaron la oferta. Analizar el tono puede mostrar que la cantidad de personas que responden con tono de enojo es desproporcionadamente alta a cierta hora del día. Esto puede sugerir que el problema no es tanto que el producto no sea atractivo, sino que a las personas les molesta que les llamen después de una hora determinada y es más probable que sean hostiles a un intento de venta independientemente del producto.

Existen varios tipos diferentes de análisis del habla, cada uno de los cuales aporta una mayor precisión a los resultados y aumenta el tiempo necesario para escanear el habla y la cantidad de habla necesaria para detectar un patrón. El tipo más simple es fonético, que descompone el habla en sonidos individuales. Si bien no es sofisticado, esto facilita la búsqueda de nuevas frases sin tener que volver a escanear el discurso desde cero. La detección de palabras clave busca palabras completas desde el principio. El reconocimiento de voz continuo de vocabulario grande tiene como objetivo transcribir de manera efectiva todo el discurso, de modo que una conversación completa esté disponible para su análisis.