Aportaciones a la mejora de los sistemas de reconocimiento

  1. Docío Fernández, Laura
Supervised by:
  1. Carmen García Mateo Director

Defence university: Universidade de Vigo

Fecha de defensa: 29 May 2001

Committee:
  1. Antonio José Rubio Ayuso Chair
  2. José Luis Alba Castro Secretary
  3. Luis Alfonso Hernández Gómez Committee member
  4. Francisco Javier Hernando Pericás Committee member
  5. Belén Ruiz Mezcua Committee member
Department:
  1. Teoría do sinal e comunicacións

Type: Thesis

Teseo: 86003 DIALNET

Abstract

El Reconocimiento Automatico de Voz(ASR-Automatic Speech Recognition) es un campo de investigacion de creciente relevancia que dia a dia se gana más adeptos, El desarrollo de mejores algoritmos y de modelados mas precisos, junto con la aparición de sistemas informaticos más potentes y asequibles, posibilita la integracion de los sistemas de dialogo hombre-maquina a traves de la voz que numeroso ambitos de la sociedad actual. Estos sistemas de dialogo permiten el acceso a una gran cantidad de informacion a traves de una forma de comunicación tan natural como es el habla, facilitando un elevado número de servicios interactivos utilizando el telefono, la televisión o el ordenador como elementos de acceso. Los sistemas ASR se encuentran con una serie de dificultades cuando el canal de comunicación con el que van a trabajar no es predecible. Este problema es crucial en el desarrollo de aplicaciones factibles en dominios prometedores como son la telefonia y los coches. Los principales problema encontrados se deben al locutor y a la tarea, al uso de microfonos con diferentes caracteristicas, a la calidad variable de los canales de transmisión, a la reverberacion y ecos, en la distancia y direccion variable al microfono introducida por el reconocimiento con manos-libres, y al ruido ambiente que distorsiona las señales de voz de entrada. El Reconocimiento Robusto de Voz trata con los desajustes entre entrenamiento y operación. Las tecnicas más recientes para reconocimiento robusto de voz se han enfocado principalmente en : 1)tecnicas de pre-procesado robusto de la señal de voz, y 2) compensación de caracteristicas y modelos. Entre los metodos desarrollados para tratar con los desajustes entre datos de entrenamiento y de operación, las tecnicas de adaptación/compensacion estan teniendo mucho interes debido a su capacidad para tratar con un ampli rango de variaciones de canal y ruido, junto con diferencias en locutores y estilos de