Aplicación de procesamiento del lenguaje natural (PLN) para la predicción del impacto de noticias colombianas en el índice COLCAP (Bolsa de Colombia)
Archivos
Fecha
Fecha
Autores
Director de trabajo de grado
Título de la revista
ISSN de la revista
Título del volumen
Editor
Seleccione un documento PDF para visualizar
Resumen
Este estudio analiza cómo el lenguaje utilizado en noticias económicas puede anticipar las variaciones diarias del índice COLCAP, principal referente bursátil de Colombia. A partir de investigaciones previas en lingüística financiera y análisis de sentimientos, se propone un enfoque basado en aprendizaje profundo que integra representaciones semánticas de noticias con indicadores financieros tradicionales. Se emplea un corpus curado de noticias económicas colombianas, tanto en su versión completa como en resúmenes generados automáticamente, del cual se extraen características como polaridad, subjetividad, distribución temática y frecuencias de términos. Se entrenaron más de 700 modelos de perceptrón multicapa (MLP) aplicando búsqueda en malla sobre distintas configuraciones de profundidad, regularización, reducción dimensional con PCA y filtrado semántico. Los resultados muestran que los modelos basados en resúmenes superan a los que usan texto completo en todas las métricas (precisión, F1, recall y exactitud), alcanzando un máximo de 61.4% de precisión. Asimismo, se observa que una inclusión excesiva de términos léxicos reduce el rendimiento, mientras que el uso selectivo de variables semánticas mejora la capacidad de generalización. Esta investigación demuestra la viabilidad de aplicar técnicas de Procesamiento de Lenguaje Natural (PLN) en el análisis financiero de mercados emergentes, y resalta el valor predictivo que pueden tener los resúmenes noticiosos.
