Aportaciones a la mejora de los sistemas de reconocimiento

Docío Fernández, Laura

Aportaciones a la mejora de los sistemas de reconocimiento

Docío Fernández, Laura

Dirixida por:

Carmen García Mateo Director

Universidade de defensa: Universidade de Vigo

Fecha de defensa: 29 de maio de 2001

Tribunal:

Antonio José Rubio Ayuso Presidente/a
José Luis Alba Castro Secretario
Luis Alfonso Hernández Gómez Vogal
Francisco Javier Hernando Pericás Vogal
Belén Ruiz Mezcua Vogal

Departamento:

Teoría do sinal e comunicacións

Tipo: Tese

Teseo: 86003 DIALNET

Resumo

El Reconocimiento Automatico de Voz(ASR-Automatic Speech Recognition) es un campo de investigacion de creciente relevancia que dia a dia se gana más adeptos, El desarrollo de mejores algoritmos y de modelados mas precisos, junto con la aparición de sistemas informaticos más potentes y asequibles, posibilita la integracion de los sistemas de dialogo hombre-maquina a traves de la voz que numeroso ambitos de la sociedad actual. Estos sistemas de dialogo permiten el acceso a una gran cantidad de informacion a traves de una forma de comunicación tan natural como es el habla, facilitando un elevado número de servicios interactivos utilizando el telefono, la televisión o el ordenador como elementos de acceso. Los sistemas ASR se encuentran con una serie de dificultades cuando el canal de comunicación con el que van a trabajar no es predecible. Este problema es crucial en el desarrollo de aplicaciones factibles en dominios prometedores como son la telefonia y los coches. Los principales problema encontrados se deben al locutor y a la tarea, al uso de microfonos con diferentes caracteristicas, a la calidad variable de los canales de transmisión, a la reverberacion y ecos, en la distancia y direccion variable al microfono introducida por el reconocimiento con manos-libres, y al ruido ambiente que distorsiona las señales de voz de entrada. El Reconocimiento Robusto de Voz trata con los desajustes entre entrenamiento y operación. Las tecnicas más recientes para reconocimiento robusto de voz se han enfocado principalmente en : 1)tecnicas de pre-procesado robusto de la señal de voz, y 2) compensación de caracteristicas y modelos. Entre los metodos desarrollados para tratar con los desajustes entre datos de entrenamiento y de operación, las tecnicas de adaptación/compensacion estan teniendo mucho interes debido a su capacidad para tratar con un ampli rango de variaciones de canal y ruido, junto con diferencias en locutores y estilos de