Análisis morfosintáctico estadístico en lengua gallega
- Méndez Pazó, Francisco
- Fernández Rei, Elisa
- Rodríguez Banga, Eduardo
- Campillo Díaz, Francisco
ISSN: 1135-5948
Año de publicación: 2003
Número: 31
Páginas: 159-166
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
En este artículo describimos la construcción de un analizador morfosintáctico en gallego que, además de su evidente interés lingüístico, sea fácilmente aplicable a sistemas de reconocimiento y síntesis de voz. Los modelos estadísticos han demostrado que son capaces de ofrecer unas prestaciones similares a sistemas que emplean innumerables reglas intrincadas que, por otro lado, son muy difíciles de depurar y mantener. Por el contrarío los modelos estocásticos permiten un diseño rápido, sí se dispone de un corpus de entrenamiento, y son extremadamente flexibles, ya que pueden ser adaptados a otro idioma sin modificaciones excesivas del código. Para entrenar los modelos estadísticos se ha comenzado la recogida de un corpus en gallego que, por el momento, consta de unas 400.000 palabras etiquetadas morfosintácticamente.