CSL: Un léxico combinado en español – Recurso para la clasificación de la polaridad y el análisis de los sentimientos

La minería de opiniones y el análisis de sentimientos en textos de redes sociales como Twitter han cobrado gran importancia durante la última década. Los léxicos de calidad para la tarea de análisis de sentimientos se encuentran fácilmente en idiomas como el inglés; sin embargo, no es el caso del español. Por esta razón, proponemos CSL, un enfoque de léxico combinado en español para el análisis de sentimientos que utiliza un conjunto de seis léxicos en español y una estrategia de bolsa ponderada de palabras. Para construir el CSL utilizamos 68.019 tweets previamente clasificados por investigadores de la Sociedad Española de Procesamiento del Lenguaje Natural (SEPLN) obteniendo una precisión de 62,05 y una recordación de 60,75 en el conjunto de validación, mostrando mejoras en ambas mediciones. 
Además, comparamos los resultados de CSL con un software comercial muy conocido para el análisis de sentimientos en español, encontrando una mejora de 10 puntos en la precisión y 15 puntos en el recuerdo.

Ver mas…