Aportaciones a la mejora de los sistemas de reconocimiento

Docío Fernández, Laura

Aportaciones a la mejora de los sistemas de reconocimiento

Docío Fernández, Laura

Supervised by:

Carmen García Mateo Director

Defence university: Universidade de Vigo

Fecha de defensa: 29 May 2001

Committee:

Antonio José Rubio Ayuso Chair
José Luis Alba Castro Secretary
Luis Alfonso Hernández Gómez Committee member
Francisco Javier Hernando Pericás Committee member
Belén Ruiz Mezcua Committee member

Department:

Teoría do sinal e comunicacións

Type: Thesis

Teseo: 86003 DIALNET

Abstract

El Reconocimiento Automatico de Voz(ASR-Automatic Speech Recognition) es un campo de investigacion de creciente relevancia que dia a dia se gana más adeptos, El desarrollo de mejores algoritmos y de modelados mas precisos, junto con la aparición de sistemas informaticos más potentes y asequibles, posibilita la integracion de los sistemas de dialogo hombre-maquina a traves de la voz que numeroso ambitos de la sociedad actual. Estos sistemas de dialogo permiten el acceso a una gran cantidad de informacion a traves de una forma de comunicación tan natural como es el habla, facilitando un elevado número de servicios interactivos utilizando el telefono, la televisión o el ordenador como elementos de acceso. Los sistemas ASR se encuentran con una serie de dificultades cuando el canal de comunicación con el que van a trabajar no es predecible. Este problema es crucial en el desarrollo de aplicaciones factibles en dominios prometedores como son la telefonia y los coches. Los principales problema encontrados se deben al locutor y a la tarea, al uso de microfonos con diferentes caracteristicas, a la calidad variable de los canales de transmisión, a la reverberacion y ecos, en la distancia y direccion variable al microfono introducida por el reconocimiento con manos-libres, y al ruido ambiente que distorsiona las señales de voz de entrada. El Reconocimiento Robusto de Voz trata con los desajustes entre entrenamiento y operación. Las tecnicas más recientes para reconocimiento robusto de voz se han enfocado principalmente en : 1)tecnicas de pre-procesado robusto de la señal de voz, y 2) compensación de caracteristicas y modelos. Entre los metodos desarrollados para tratar con los desajustes entre datos de entrenamiento y de operación, las tecnicas de adaptación/compensacion estan teniendo mucho interes debido a su capacidad para tratar con un ampli rango de variaciones de canal y ruido, junto con diferencias en locutores y estilos de