Reconocimiento robusto del locutor mediante adaptación jacobiana de los modelos acústicos

ANGUITA ORTEGA, JAN

Reconocimiento robusto del locutor mediante adaptación jacobiana de los modelos acústicos

ANGUITA ORTEGA, JAN

Zuzendaria:

Francisco Javier Hernando Pericás Zuzendaria

Defentsa unibertsitatea: Universitat Politècnica de Catalunya (UPC)

Fecha de defensa: 2007(e)ko azaroa-(a)k 23

Epaimahaia:

Climent Nadeu Camprubí Presidentea
Antonio Bonafonte Cávez Idazkaria
Javier Rodríguez Saeta Kidea
Francisco Javier Caminero Gil Kidea
Laura Docío Fernández Kidea

Mota: Tesia

Teseo: 141064 DIALNET

Laburpena

El desarrollo de tecnologías capaces de reconocer de forma automática a una persona mediante su voz ha experimentado un creciente interés en los últimos años debido a sus múltiples aplicaciones: controles de acceso, transacciones financieras y comerciales, indexación de audio de reuniones y de programas de radio y televisión, investigación policial, personalización de servicios... Cuando los sistemas de reconocimiento del locutor se enfrentan a aplicaciones reales sus prestaciones se ven severamente degradadas por el desajuste entre las condiciones de la fase de entrenamiento y las de la fase de reconocimiento. Este desajuste está generalmente asociado al ruido ambiental y a la distorsión de canal. La necesidad de reducir estos efectos se ha convertido en un importante desafío para la tecnología del habla. En los últimos años se han propuesto varias técnicas robustas de reconocimiento incluyendo nuevas representaciones de la voz y técnicas de compensación de los parámetros y los modelos acústicos. En esta tesis se han evaluado una serie de técnicas de mejora de la calidad de la señal de voz, de extracción y compensación de parámetros y de adaptación de los modelos acústicos con el objetivo de reducir las tasas de error del sistema en diferentes condiciones de ruido y con diferentes tipos de micrófonos. Se ha prestado especial atención a la adaptación Jacobiana (JA), una técnica que permite adaptar los modelos a los cambios de ruido, y se ha mejorado para hacerla más adecuada a los sistemas de reconocimiento del locutor. La adaptación Jacobiana adapta los modelos acústicos en función de la diferencia entre las condiciones de ruido en las etapas de entrenamiento y test. Por este motivo es necesario estimar una referencia del ruido en ambas etapas.