Reconocimiento y generación de palabras compuestas en español

  1. GUTIÉRREZ RODRÍGUEZ, VIRGINIA
Supervised by:
  1. José Rafael Pérez Aguiar Director
  2. Octavio Santana Suárez Director

Defence university: Universidad de Las Palmas de Gran Canaria

Fecha de defensa: 10 February 2016

Committee:
  1. Manuel Alvar Ezquerra Chair
  2. Luis González Sánchez Secretary
  3. Manuel Pérez Cota Committee member
  4. Antonio Núñez Ordóñez Committee member
  5. Fernando Pérez Nava Committee member

Type: Thesis

Abstract

Uno de los medios con los que cuenta la lengua española para ampliar el conjunto de voces del idioma consiste en la utilización de mecanismos de tipo morfológico para formar nuevas palabras: la composición es, sin duda, uno de los procesos de formación de palabras de mayor importancia —aunque haya recibido escaso tratamiento por parte de la bibliografía— de los que dispone la lengua para la renovación y enriquecimiento del léxico, también recibe el nombre neologismo morfosintáctico, se basa en coordinar o interaccionar específicamente dos o más lexemas —o raíces cultas— para formar una nueva palabra que compone una unidad semántica y sintáctica. En esta Tesis se estudian únicamente aquellos casos en los que la palabra compuesta se ha consolidado como la unión gráfica de los elementos que la producen de forma regular o irregular. Se extraen de diferentes fuentes léxicas —Internet y el lenguaje periodístico recogen, con frecuencia, neologismos compositivos debido a la rápida evolución de los acontecimientos y a su inmediata trascripción al mundo de las Tecnologías de la Información— los distintos integrantes y se examinan los mecanismos aplicados para establecer su comportamiento morfosemántico y su generación. Se hacen imprescindibles unos procesos automáticos que sean capaces de identificar las palabras interesadas y situarlas en un contexto lingüístico adecuado. El reconocimiento de palabras compuestas en español es útil en aplicaciones para el procesamiento automático del lenguaje natural, debido a que lleva implícito vínculos semánticos; asimismo, potencia las búsquedas en Internet, al ampliar el abanico de relaciones morfoléxicas deducidas de los compuestos bajo estudio, sus derivaciones y flexiones. Además del desarrollo de una herramienta lingüística que permite reconocer palabras compuestas, parasintéticas por composición o neologismos compositivos, entre otros procesos de lexicalización, se incluye la generación de las informadas alteraciones morfoléxicas — se tienen en cuenta las reglas de formación, fonéticas y excepciones e irregularidades detectadas.