Reconocimiento robusto del locutor mediante adaptación jacobiana de los modelos acústicos

ANGUITA ORTEGA, JAN

Reconocimiento robusto del locutor mediante adaptación jacobiana de los modelos acústicos

ANGUITA ORTEGA, JAN

Dirixida por:

Francisco Javier Hernando Pericás Director

Universidade de defensa: Universitat Politècnica de Catalunya (UPC)

Fecha de defensa: 23 de novembro de 2007

Tribunal:

Climent Nadeu Camprubí Presidente/a
Antonio Bonafonte Cávez Secretario/a
Javier Rodríguez Saeta Vogal
Francisco Javier Caminero Gil Vogal
Laura Docío Fernández Vogal

Tipo: Tese

Teseo: 141064 DIALNET

Resumo

El desarrollo de tecnologías capaces de reconocer de forma automática a una persona mediante su voz ha experimentado un creciente interés en los últimos años debido a sus múltiples aplicaciones: controles de acceso, transacciones financieras y comerciales, indexación de audio de reuniones y de programas de radio y televisión, investigación policial, personalización de servicios... Cuando los sistemas de reconocimiento del locutor se enfrentan a aplicaciones reales sus prestaciones se ven severamente degradadas por el desajuste entre las condiciones de la fase de entrenamiento y las de la fase de reconocimiento. Este desajuste está generalmente asociado al ruido ambiental y a la distorsión de canal. La necesidad de reducir estos efectos se ha convertido en un importante desafío para la tecnología del habla. En los últimos años se han propuesto varias técnicas robustas de reconocimiento incluyendo nuevas representaciones de la voz y técnicas de compensación de los parámetros y los modelos acústicos. En esta tesis se han evaluado una serie de técnicas de mejora de la calidad de la señal de voz, de extracción y compensación de parámetros y de adaptación de los modelos acústicos con el objetivo de reducir las tasas de error del sistema en diferentes condiciones de ruido y con diferentes tipos de micrófonos. Se ha prestado especial atención a la adaptación Jacobiana (JA), una técnica que permite adaptar los modelos a los cambios de ruido, y se ha mejorado para hacerla más adecuada a los sistemas de reconocimiento del locutor. La adaptación Jacobiana adapta los modelos acústicos en función de la diferencia entre las condiciones de ruido en las etapas de entrenamiento y test. Por este motivo es necesario estimar una referencia del ruido en ambas etapas.