Tecnología

¿Qué es un sintetizador de voz?

El sintetizador de voz es un dispositivo que se utiliza para traducir caracteres de texto en sonidos que se aproximan al sonido del habla humana. Dependiendo del nivel de sofisticación del dispositivo individual, los sonidos producidos pueden ser algo rígidos y artificiales, o sonar muy parecidos a la voz de una persona real. El concepto de síntesis de voz ha existido durante siglos, pero solo en las últimas décadas el proceso ha estado disponible para el público en general.

Hay ejemplos de intentos de producir artificialmente patrones de habla humana que se remontan al siglo XI. Los primeros intentos a menudo usaban materiales para replicar las cuerdas vocales humanas y aplicar varios tipos de estimulación para producir sonidos. Con el tiempo, los diseños permitieron producir sonidos que imitaban la pronunciación de las vocales. En la última parte del siglo XVIII, algunos diseños también podían producir sonidos que se parecían mucho a las consonantes.

El progreso real con el sintetizador de voz moderno comenzó en la década de 1930. Los Laboratorios Bell produjeron un sintetizador que se denominó vocoder. Los datos se ingresaron con el uso de un teclado, analizados por el sistema, y se emitieron los sonidos apropiados para formar palabras. Si bien la entonación y la inflexión de las palabras fueron algo primitivas, el dispositivo produjo palabras claramente inteligibles. Una versión refinada de este dispositivo, el voder, se presentó al público en la Feria Mundial de 1939.

Para la década de 1950, trabajar en un sintetizador de voz que usaría imágenes visuales y texto ingresado produjo resultados parcialmente exitosos. Al mismo tiempo, los avances tecnológicos comenzaron a refinar la calidad del sonido. Para cuando las comunicaciones de voz automatizadas se hicieron más frecuentes en la década de 1970, había varios sintetizadores de voz que eran capaces de producir sonidos muy cercanos a los patrones de voz humanos. En poco tiempo, los dispositivos se estaban utilizando para producir productos como mensajes pregrabados en contestadores automáticos y productos de lectura para personas con discapacidad visual.

La llegada de la computadora personal también abrió la puerta a nuevos refinamientos para el sintetizador de voz. Al incluir el dispositivo en un sistema informático doméstico, las personas con discapacidades de lectura o visión limitada pueden disfrutar usando una variedad de programas informáticos. Hoy, la calidad de voz en la mayoría de los modelos del sintetizador de voz está muy alejada de los sonidos robóticos producidos por dispositivos creados a principios del siglo XX. Muchas versiones actuales son capaces de producir patrones de voz que son casi indistinguibles del habla humana.