Robustez en reconocimiento fonético de voz para aplicaciones telefónicas

  1. Puertas Terá, José Ignacio
Dirixida por:
  1. Ramón García Gómez Director

Universidade de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 28 de febreiro de 2000

Tribunal:
  1. Juan Francisco Gómez Mena Presidente/a
  2. Luis Alfonso Hernández Gómez Secretario/a
  3. Antonio José Rubio Ayuso Vogal
  4. Carmen García Mateo Vogal
  5. María Asunción Moreno Bilbao Vogal

Tipo: Tese

Resumo

La tesis estudia diferentes técnicas orientadas a combatir las principales fuentes o causas de error en los sistemas de Reconocimiento Automático de Habla que operan en aplicaciones Telefónicas. Los trabajos comienzan con la presentación de los aspectos básicos de diseño de un reconocedor de habla basado en Modelos Ocultos de Markov. Se consideran, estudian y evalúan técnicas de robustez orientadas, principalmente, a la diferente forma de hablar de locutores diferentes, a las variaciones del canal, y a la posible presencia de ruidos, distorisiones y palabras fuera del vocabulario que emplee el usuario del sistema. Concretamente se estudian técnicas como las sutracción de la media cepstral (CMN), y la técnica conocida como RASTA. Se discute también la utilización del procedimientos para el rechazo de pronunciaciones incorrectas. La evolución de resultados se realiza sobre una base de datos telefónica capturada dentro de los trabajos de la Tesis, y que contiene un vocabulario reducido de dígitos, comandos y 100 nombres.