Prediction of agricultural production in Colombia using regression models : a comparative analysis.
Archivos
Fecha
Fecha
Autores
Director de trabajo de grado
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
Este estudio presenta una metodología basada en datos para la predicción del rendimiento agrícola en Colombia, utilizando conjuntos de datos semestrales segmentados por cultivo y municipio entre 2006 y 2023. Siguiendo la metodología CRISP-DM, el proyecto incluye las fases de comprensión del dominio, preparación de datos, modelado, evaluación y despliegue. Se implementaron dos estrategias de modelado: una ruta manual, que permitió un control detallado de la ingeniería de características y del preprocesamiento de los datos, y una ruta automatizada mediante el uso del framework PyCaret, la cual facilitó la comparación de algoritmos y la optimización de hiperparámetros. Se evaluaron diversas técnicas de regresión, incluyendo XGBoost, LightGBM, Random Forest, Gradient Boosting y Support Vector Regression. La evaluación de los modelos se basó en las métricas MAE, RMSE y R². Los resultados muestran que el modelado automatizado con PyCaret logró un desempeño predictivo superior en comparación con los enfoques manuales. Este trabajo ofrece un marco reproducible para el despliegue de herramientas predictivas en la planificación agrícola y resalta oportunidades de investigación futura mediante la integración de datos externos y métodos de aprendizaje profundo.
