Confidence measures for speech recognition and utterance verification

  1. HERNANDEZ ABREGO, GUSTAVO ADOLFO
Dirixida por:
  1. José Bernardo Mariño Acebal Director

Universidade de defensa: Universitat Politècnica de Catalunya (UPC)

Fecha de defensa: 01 de xuño de 2000

Tribunal:
  1. Antonio Bonafonte Cávez Presidente/a
  2. Enric Monte Moreno Secretario/a
  3. Carmen García Mateo Vogal
  4. Rafid Sukkar Vogal
  5. M. Carmen Benítez Ortuzar Vogal

Tipo: Tese

Teseo: 78981 DIALNET

Resumo

Esta investigación está dedicada al estudio e implantación de métodos eficaces para medir los niveles de confianza de las hipótesis resultantes del reconocimiento automático del habla. Asi mismo, este trabajo se ocupa de una de las posibles aplicaciones de las medidas de confianza: la verificación de las hipótesis de reconocimiento (en ocasiones llamada verificación de la elocución). Tambien es proposito de esta investigación desarrollar sistemas eficientes y flexibles. El sistema etiquetador de confianza se plantea como un módulo agregado a cualquier sistema de reconocimiento de habla, respetando la configuración original de dicho sistema y empleado datos procedentes exclusivamente de la salida del reconocedor. Estos datos se refieren a una serie de características del reconocimiento que contienen información relacionada con la exactitud del procedimiento reconocedor. Dichas características se calculan mediante la comparación de la información de las hipótesis de reconocimiento con la información obtenida a partir de los resultados de un reconocedor alternativo. Debido al bajo nivel de restricciones aplicado al sistema alternativo, este es capaz de manejar cualquier tipo de señal de voz, incluyendo ruidos perturbadores, palabras mal formadas y elementos de habla desconocidos por el sistema. Por otra parte, las hipotesis generadas por el sistema alternativo rara vez son correctas. Sin embargo, un sistema alternativo como este es un buen punto de referencia para corroborar los resultados del reconocedor principal. Las caracteristicas del reconocimiento pueden usarse como evaluadores de los niveles de confianza que, combinados de manera eficiente, generan una nueva medida compuesta cuyas prestaciones son superiores a las de las caracteristicas del reconocimiento por si mismas. Diversos esquemas de combinacion de variables son probados abarcando desde los sistemas lineales hasta las redes neuronales y los sistemas de l