Análisis morfosintáctico estadístico en lengua gallega

  1. Méndez Pazó, Francisco
  2. Fernández Rei, Elisa
  3. Rodríguez Banga, Eduardo
  4. Campillo Díaz, Francisco
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2003

Número: 31

Páginas: 159-166

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo describimos la construcción de un analizador morfosintáctico en gallego que, además de su evidente interés lingüístico, sea fácilmente aplicable a sistemas de reconocimiento y síntesis de voz. Los modelos estadísticos han demostrado que son capaces de ofrecer unas prestaciones similares a sistemas que emplean innumerables reglas intrincadas que, por otro lado, son muy difíciles de depurar y mantener. Por el contrarío los modelos estocásticos permiten un diseño rápido, sí se dispone de un corpus de entrenamiento, y son extremadamente flexibles, ya que pueden ser adaptados a otro idioma sin modificaciones excesivas del código. Para entrenar los modelos estadísticos se ha comenzado la recogida de un corpus en gallego que, por el momento, consta de unas 400.000 palabras etiquetadas morfosintácticamente.