Publicación:
Modelado predictivo del flujo de pasajeros en el aeropuerto el dorado usando sarima, arima y lstm (1996–2024)

dc.contributor.advisorGalpin, Ixent
dc.creatorBeltrán Páez, Erika Mildreey
dc.date.accessioned2025-09-04T22:52:53Z
dc.date.available2025-09-04T22:52:53Z
dc.date.created2025-08-29
dc.description.abstractEl Aeropuerto Internacional El Dorado, ubicado en Bogotá, es uno de los más importantes de América Latina y destaca por su alta eficiencia operativa y conectividad aérea. Su creciente volumen de pasajeros a más de 38 millones en 2023, plantea retos significativos para la planificación y gestión de recursos. Esta tesis se enfoca en el desarrollo e implementación de modelos predictivos para estimar el flujo mensual de pasajeros nacionales e internacionales en el aeropuerto, utilizando datos históricos desde 1996 hasta 2024 proporcionados por la Unidad Administrativa Especial de Aeronáutica Civil de Colombia. Se aplican tres modelos avanzados de series temporales: ARIMA, SARIMA y LSTM. El modelo SARIMA se destaca por su capacidad para capturar patrones estacionales y tendencias recurrentes en los datos, lo que resulta en una mejor precisión en la predicción comparado con ARIMA y LSTM. La evaluación se realiza mediante validación cruzada específica para series temporales (TimeSeriesSplit), y se utilizan métricas objetivas como RMSE (Root Mean Squared Error) y MAE (Mean Absolute Error) para medir la desviación entre los valores predichos y los reales. El estudio sigue la metodología CRISP-DM, que comprende la comprensión del negocio y los datos, la preparación rigurosa del conjunto de datos (incluyendo limpieza, normalización y suavización), el modelado, la evaluación y finalmente el despliegue de los resultados. La depuración de los datos fue clave, dado que la información histórica presentaba inconsistencias y valores faltantes. Los resultados muestran que SARIMA es el modelo más adecuado para la predicción del flujo de pasajeros en El Dorado debido a su manejo eficiente de la estacionalidad inherente al tráfico aéreo. Aunque LSTM es un modelo poderoso para secuencias complejas, su desempeño fue inferior en este contexto, posiblemente debido a limitaciones en la cantidad y calidad de datos, así como a la necesidad de un ajuste más fino de hiperparámetros. Como propuesta final, se sugiere el despliegue de las predicciones en herramientas interactivas, como dashboards y chatbots, para facilitar el acceso a información en tiempo real. Esto apoyaría la toma de decisiones estratégicas, optimizando la asignación de recursos, mejorando la experiencia del pasajero y fortaleciendo la gestión operativa del aeropuerto. Esta investigación no solo contribuye al conocimiento del comportamiento del flujo de pasajeros en un aeropuerto de alta demanda, sino que también abre la puerta a futuras investigaciones en aeropuertos y sistemas de transporte similares. Se recomienda explorar modelos híbridos que combinen métodos estadísticos y aprendizaje profundo para mejorar la robustez y adaptabilidad de las predicciones.spa
dc.description.abstractenglishEl Dorado International Airport, located in Bogotá, is one of the most important airports in Latin America, renowned for its high operational efficiency and outstanding air connectivity. In 2023, it surpassed 38 million passengers, presenting significant challenges for efficient resource planning and management. This thesis focuses on the development and implementation of predictive models to estimate the monthly passenger flow, both domestic and international, using historical data from 1996 to 2024 provided by Colombia's Special Administrative Unit of Civil Aeronautics. Three advanced time series models were evaluated: ARIMA, SARIMA, and LSTM. The SARIMA model stood out for its ability to capture seasonal patterns and recurring trends, achieving higher prediction accuracy compared to ARIMA and LSTM. Validation was conducted using a time series-specific cross-validation technique (TimeSeriesSplit), and objective metrics such as RMSE and MAE were used to quantify the deviation between predicted and actual values. The study followed the CRISP-DM methodology, which includes understanding the business and data, rigorous data preparation (cleaning, normalization, and smoothing), modeling, evaluation, and final deployment of results. Data cleaning was crucial due to inconsistencies and missing values in the historical data. Results indicate that SARIMA is the most suitable model for predicting passenger flow at El Dorado due to its effective handling of the seasonality inherent in air traffic. Although LSTM is powerful for complex sequences, its performance was inferior in this case, likely due to limitations in data quantity and quality, as well as the need for finer hyperparameter tuning. Finally, the deployment of predictions through interactive tools such as dashboards and chatbots is proposed to facilitate real-time access to information. This would support strategic decision-making, optimize resource allocation, improve passenger experience, and strengthen airport operational management. This research contributes valuable insights into passenger flow behavior at a high-demand airport and opens the door to future studies in airports and similar transportation systems. It is recommended to explore hybrid models combining statistical methods and deep learning to enhance prediction robustness and adaptability.spa
dc.format.extent39 paginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.urihttps://hdl.handle.net/20.500.12010/37606
dc.language.isospaspa
dc.relation.referencesInstituto Distrital de Turismo. (2024). El Dorado, el aeropuerto mejor conectado de América Latina y destaca en el top 20 global. https://www.idt.gov.co/es/el-dorado-el-aeropuerto-mejor-conectado-de america-latina-y-destaca-en-el-top-20-globalspa
dc.relation.referencesShearer, C. (2000). The CRISP-DM model: The new blueprint for data mining. Journal of Data Warehousing, 5(4), 13–22spa
dc.relation.referencesAnguita, D., Ghelardoni, L., Ghio, A., Oneto, L., & Ridella, S. (n.d.). The “K” in K-fold Cross Validation. Retrieved March 22, 2025, from http://www.i6doc.com/en/livre/?GCOI=28001100967420.spa
dc.relation.referencesBases de Datos. (n.d.). Retrieved March 22, 2025, from https://www.aerocivil.gov.co/atencion/estadisticas-de-las-actividades aeronauticas/bases-de-datospa
dc.relation.referencesBergmeir, C., & Benítez, J. M. (2012). On the use of cross-validation for time series predictor evaluation. Information Sciences, 191, 192–213. https://doi.org/10.1016/J.INS.2011.12.028spa
dc.relation.referencesDickey, D. A., & Fuller, W. A. (1979). Distribution of the Estimators for Autoregressive Time Series With a Unit Root. Journal of the American Statistical Association, 74(366), 427. https://doi.org/10.2307/2286348spa
dc.relation.referencesDickey, D. G. (2011). Dickey-Fuller Tests. International Encyclopedia of Statistical Science, 385–388. https://doi.org/10.1007/978-3-642-04898-2_210spa
dc.relation.referencesDonate, J. P., Cortez, P., Sánchez, G. G., & De Miguel, A. S. (2013). Time series forecasting using a weighted cross-validation evolutionary artificial neural network ensemble. Neurocomputing, 109, 27–32.spa
dc.relation.referencesEl Aeropuerto El Dorado continúa recibiendo premios por esta razón | Infraestructura | Economía | Portafolio. (n.d.). Retrieved March 22, 2025, from https://www.portafolio.co/economia/infraestructura/el-aeropuerto-el-dorado continua-recibiendo-premios-por-esta-razon-623809spa
dc.relation.referencesForecasting: principles and practice - Rob J Hyndman, George Athanasopoulos - Google Libros. (n.d.). Retrieved March 22, 2025, from https://books.google.com.co/books?hl=es&lr=&id=_bBhDwAAQBAJ&oi=fnd&pg=PA7 &dq=10.+Hyndman,+R.+J.,+%26+Athanasopoulos,+G.+(2018).+Forecasting:+Principl es+and+Practice+(2nd+ed.).+OTexts.&ots=TjiXAkTPLL&sig=QXHDvy8FJ9GvKKjFvnFw XXV3yxQ#v=onepage&q&f=falsespa
dc.relation.referencesGuimarães, M., Soares, C., & Ventura, R. (2022). Decision Support Models for Predicting and Explaining Airport Passenger Connectivity From Data. IEEE Transactions on Intelligent Transportation Systems, 23(9), 16005–16015. https://doi.org/10.1109/TITS.2022.3147155spa
dc.relation.referencesHarris, R. I. D. (1992). Testing for unit roots using the augmented Dickey-Fuller test: Some issues relating to the size, power and the lag structure of the test. Economics Letters, 38(4), 381–386. https://doi.org/10.1016/0165-1765(92)90022-Qspa
dc.relation.referencesHyndman, R. J., & Khandakar, Y. (2008). Automatic Time Series Forecasting: The forecast Package for R. Journal of Statistical Software, 27(3), 1–22. https://doi.org/10.18637/JSS.V027.I03spa
dc.relation.referencesHyndman, R., Koehler, A., Ord, K., & Snyder, R. (2008). Forecasting with Exponential Smoothing. https://doi.org/10.1007/978-3-540-71918-2spa
dc.subjectModelos predictivosspa
dc.subjectestadísticaspa
dc.subjectpythonspa
dc.subjectanalitica de datosspa
dc.subjectseries de tiempospa
dc.subjectvalidación cruzadaspa
dc.subject.keywordPredictive modelsspa
dc.subject.keywordStatisticsspa
dc.subject.keywordPythonspa
dc.subject.keywordData analyticsspa
dc.subject.keywordTime seriesspa
dc.subject.keywordCross-validationspa
dc.subject.lembAeropuertos -- Administración
dc.subject.lembTransporte aéreo de pasajeros
dc.subject.lembRedes neuronales (Computación)
dc.titleModelado predictivo del flujo de pasajeros en el aeropuerto el dorado usando sarima, arima y lstm (1996–2024)spa
dc.type.coarhttp://purl.org/coar/resource_type/c_2df8fbb1spa
dspace.entity.typePublication
relation.isAdvisorOfPublication62b7a41a-cabb-4bd9-8ac6-c7fa279941ec
relation.isAdvisorOfPublication.latestForDiscovery62b7a41a-cabb-4bd9-8ac6-c7fa279941ec

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Erika Beltrán Trabajo De Grado .pdf
Tamaño:
2.22 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
2.87 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
Cargando...
Miniatura
Nombre:
FOR-EFE-GDB-007_AUTORIZACION_DE_PUBLICACION_DE_TESIS_O_TRABAJO_DE_GRADO_IG2 (1).pdf
Tamaño:
130.79 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta de autorización