Aportaciones a la mejora de los sistemas de reconocimiento
- Carmen García Mateo Directora
Universitat de defensa: Universidade de Vigo
Fecha de defensa: 29 de de maig de 2001
- Antonio José Rubio Ayuso President/a
- José Luis Alba Castro Secretari
- Luis Alfonso Hernández Gómez Vocal
- Francisco Javier Hernando Pericás Vocal
- Belén Ruiz Mezcua Vocal
Tipus: Tesi
Resum
El Reconocimiento Automatico de Voz(ASR-Automatic Speech Recognition) es un campo de investigacion de creciente relevancia que dia a dia se gana más adeptos, El desarrollo de mejores algoritmos y de modelados mas precisos, junto con la aparición de sistemas informaticos más potentes y asequibles, posibilita la integracion de los sistemas de dialogo hombre-maquina a traves de la voz que numeroso ambitos de la sociedad actual. Estos sistemas de dialogo permiten el acceso a una gran cantidad de informacion a traves de una forma de comunicación tan natural como es el habla, facilitando un elevado número de servicios interactivos utilizando el telefono, la televisión o el ordenador como elementos de acceso. Los sistemas ASR se encuentran con una serie de dificultades cuando el canal de comunicación con el que van a trabajar no es predecible. Este problema es crucial en el desarrollo de aplicaciones factibles en dominios prometedores como son la telefonia y los coches. Los principales problema encontrados se deben al locutor y a la tarea, al uso de microfonos con diferentes caracteristicas, a la calidad variable de los canales de transmisión, a la reverberacion y ecos, en la distancia y direccion variable al microfono introducida por el reconocimiento con manos-libres, y al ruido ambiente que distorsiona las señales de voz de entrada. El Reconocimiento Robusto de Voz trata con los desajustes entre entrenamiento y operación. Las tecnicas más recientes para reconocimiento robusto de voz se han enfocado principalmente en : 1)tecnicas de pre-procesado robusto de la señal de voz, y 2) compensación de caracteristicas y modelos. Entre los metodos desarrollados para tratar con los desajustes entre datos de entrenamiento y de operación, las tecnicas de adaptación/compensacion estan teniendo mucho interes debido a su capacidad para tratar con un ampli rango de variaciones de canal y ruido, junto con diferencias en locutores y estilos de