Síntesis de voz de alta calidad en castellano

  1. Giménez de los Galanes Cejudo, Francisco Manuel
Dirigée par:
  1. José Manuel Pardo Muñoz Directeur/trice

Université de défendre: Universidad Politécnica de Madrid

Année de défendre: 1996

Jury:
  1. Andrés de Santos Lleó President
  2. Santiago Aguilera Navarro Secrétaire
  3. Joaquim Llisterri Boix Rapporteur
  4. Luis Alfonso Hernández Gómez Rapporteur
  5. Carmen García Mateo Rapporteur

Type: Thèses

Teseo: 56337 DIALNET

Résumé

LOS PRINCIPALES PUNTOS QUE SE TRATAN EN LA TESIS SON: REVISION DEL CONJUNTO DE TECNICAS CONOCIDO BAJO EL NOMBRE GENERICO PSOLA (PITCH-SYNCHRONOUS OVERLAP-ADD), DESARROLLO DE UN SISTEMA DE MODIFICACION PROSODICA BASADO EN TECNICAS DE REMUESTREO DE SEÑALES DIGITALES, CAPAZ DE IGUALAR LA CALIDAD OBTENIDA POR LOS METODOS PSOLA BAJO LA RESTRICCION DE UN ANCHO DE BANDA NO MAYOR DE 5 KHZ. PUESTA A PUNTO DE METODOS DE SELECCION, PREPROCESO Y CODIFICACION DE UNIDADES BASICAS DE SINTESIS. INTRODUCCION DE UN MODULO DE MODIFICACION ARBITRARIA DE LA ENVOLVENTE ESPECTRAL. APLICADO A LA TAREA DE SUAVIZADO DE TRANSICIONES ENTRE UNIDADES DE SINTESIS SE PRUEBA QUE EL METODO ES EFECTIVO Y PUEDE SERVIR PARA UN FUTURO SISTEMA DE CONVERSION DE LOCUTOR. ESTUDIO DE LA RELACION ENTRE F0 Y LOS FORMANTES PARA LAS VOCALES CASTELLANAS. LA APORTACION MAS IMPORTANTE ES LA CLARA DEPENDENCIA DE LAS RESONANCIAS VOCALES RESPECTO A F0 Y EL CARACTER CUASI-LINEAL DE ESTA DEPENDENCIA.