TASSA Naive-Bayes strategy for sentiment analysis on Spanish tweets

  1. Pablo Gamallo 1
  2. Marcos Garcia 2
  3. Santiago Fernández-Lanza 1
  1. 1 Universidade de Santiago de Compostela
    info

    Universidade de Santiago de Compostela

    Santiago de Compostela, España

    ROR https://ror.org/030eybx10

  2. 2 CILENIS, S.L.
Llibre:
XXIX Congreso de la Sociedad Española de Procesamiento de Lenguaje Natural: SEPLN 2013
  1. Alberto Díaz Esteban (coord.)
  2. Iñaki Alegria Loinaz (coord.)
  3. Julio Villena Román (coord.)

Editorial: Sociedad Española para el Procesamiento del Lenguaje Natural

ISBN: 978-84-695-8349-4

Any de publicació: 2013

Pàgines: 126-132

Congrés: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)

Tipus: Aportació congrés

Resum

En este artículo, se describe la estrategia que subyace al sistema presentado por nuestro grupo para la tarea de análisis de sentimiento en el TASS 2013. El sistema se basa principalmente en un clasificador Naive-Bayes orientado a la detección de la polaridad en tweets escritos en español. Los experimentos realizados han mostrado que los mejores resultados se han alcanzado utilizando clasificadores binarios que distinguen apenas entre dos categorías de polaridad: positivo y negativo. Para poder identificar más niveles de subjetividad, hemos incorporado al sistema umbrales de separación con los que distinguir valores de polaridad fuertes, medios y débiles o neutros. Además, para poder detectar si un tweet tiene o no tiene polaridad, el sistema incorpora también una regla básica basada en la búsqueda de palabras con polaridad dentro del texto analizado. Los resultados de la evaluación muestran valores razonablemente altos (cerca del 67% de precisión) cuando el sistema se aplica para detectar cuatro categorías de sentimiento.