Publicación: Modelado predictivo del flujo de pasajeros en el aeropuerto el dorado usando sarima, arima y lstm (1996–2024)
| dc.contributor.advisor | Galpin, Ixent | |
| dc.creator | Beltrán Páez, Erika Mildreey | |
| dc.date.accessioned | 2025-09-04T22:52:53Z | |
| dc.date.available | 2025-09-04T22:52:53Z | |
| dc.date.created | 2025-08-29 | |
| dc.description.abstract | El Aeropuerto Internacional El Dorado, ubicado en Bogotá, es uno de los más importantes de América Latina y destaca por su alta eficiencia operativa y conectividad aérea. Su creciente volumen de pasajeros a más de 38 millones en 2023, plantea retos significativos para la planificación y gestión de recursos. Esta tesis se enfoca en el desarrollo e implementación de modelos predictivos para estimar el flujo mensual de pasajeros nacionales e internacionales en el aeropuerto, utilizando datos históricos desde 1996 hasta 2024 proporcionados por la Unidad Administrativa Especial de Aeronáutica Civil de Colombia. Se aplican tres modelos avanzados de series temporales: ARIMA, SARIMA y LSTM. El modelo SARIMA se destaca por su capacidad para capturar patrones estacionales y tendencias recurrentes en los datos, lo que resulta en una mejor precisión en la predicción comparado con ARIMA y LSTM. La evaluación se realiza mediante validación cruzada específica para series temporales (TimeSeriesSplit), y se utilizan métricas objetivas como RMSE (Root Mean Squared Error) y MAE (Mean Absolute Error) para medir la desviación entre los valores predichos y los reales. El estudio sigue la metodología CRISP-DM, que comprende la comprensión del negocio y los datos, la preparación rigurosa del conjunto de datos (incluyendo limpieza, normalización y suavización), el modelado, la evaluación y finalmente el despliegue de los resultados. La depuración de los datos fue clave, dado que la información histórica presentaba inconsistencias y valores faltantes. Los resultados muestran que SARIMA es el modelo más adecuado para la predicción del flujo de pasajeros en El Dorado debido a su manejo eficiente de la estacionalidad inherente al tráfico aéreo. Aunque LSTM es un modelo poderoso para secuencias complejas, su desempeño fue inferior en este contexto, posiblemente debido a limitaciones en la cantidad y calidad de datos, así como a la necesidad de un ajuste más fino de hiperparámetros. Como propuesta final, se sugiere el despliegue de las predicciones en herramientas interactivas, como dashboards y chatbots, para facilitar el acceso a información en tiempo real. Esto apoyaría la toma de decisiones estratégicas, optimizando la asignación de recursos, mejorando la experiencia del pasajero y fortaleciendo la gestión operativa del aeropuerto. Esta investigación no solo contribuye al conocimiento del comportamiento del flujo de pasajeros en un aeropuerto de alta demanda, sino que también abre la puerta a futuras investigaciones en aeropuertos y sistemas de transporte similares. Se recomienda explorar modelos híbridos que combinen métodos estadísticos y aprendizaje profundo para mejorar la robustez y adaptabilidad de las predicciones. | spa |
| dc.description.abstractenglish | El Dorado International Airport, located in Bogotá, is one of the most important airports in Latin America, renowned for its high operational efficiency and outstanding air connectivity. In 2023, it surpassed 38 million passengers, presenting significant challenges for efficient resource planning and management. This thesis focuses on the development and implementation of predictive models to estimate the monthly passenger flow, both domestic and international, using historical data from 1996 to 2024 provided by Colombia's Special Administrative Unit of Civil Aeronautics. Three advanced time series models were evaluated: ARIMA, SARIMA, and LSTM. The SARIMA model stood out for its ability to capture seasonal patterns and recurring trends, achieving higher prediction accuracy compared to ARIMA and LSTM. Validation was conducted using a time series-specific cross-validation technique (TimeSeriesSplit), and objective metrics such as RMSE and MAE were used to quantify the deviation between predicted and actual values. The study followed the CRISP-DM methodology, which includes understanding the business and data, rigorous data preparation (cleaning, normalization, and smoothing), modeling, evaluation, and final deployment of results. Data cleaning was crucial due to inconsistencies and missing values in the historical data. Results indicate that SARIMA is the most suitable model for predicting passenger flow at El Dorado due to its effective handling of the seasonality inherent in air traffic. Although LSTM is powerful for complex sequences, its performance was inferior in this case, likely due to limitations in data quantity and quality, as well as the need for finer hyperparameter tuning. Finally, the deployment of predictions through interactive tools such as dashboards and chatbots is proposed to facilitate real-time access to information. This would support strategic decision-making, optimize resource allocation, improve passenger experience, and strengthen airport operational management. This research contributes valuable insights into passenger flow behavior at a high-demand airport and opens the door to future studies in airports and similar transportation systems. It is recommended to explore hybrid models combining statistical methods and deep learning to enhance prediction robustness and adaptability. | spa |
| dc.format.extent | 39 paginas | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.uri | https://hdl.handle.net/20.500.12010/37606 | |
| dc.language.iso | spa | spa |
| dc.relation.references | Instituto Distrital de Turismo. (2024). El Dorado, el aeropuerto mejor conectado de América Latina y destaca en el top 20 global. https://www.idt.gov.co/es/el-dorado-el-aeropuerto-mejor-conectado-de america-latina-y-destaca-en-el-top-20-global | spa |
| dc.relation.references | Shearer, C. (2000). The CRISP-DM model: The new blueprint for data mining. Journal of Data Warehousing, 5(4), 13–22 | spa |
| dc.relation.references | Anguita, D., Ghelardoni, L., Ghio, A., Oneto, L., & Ridella, S. (n.d.). The “K” in K-fold Cross Validation. Retrieved March 22, 2025, from http://www.i6doc.com/en/livre/?GCOI=28001100967420. | spa |
| dc.relation.references | Bases de Datos. (n.d.). Retrieved March 22, 2025, from https://www.aerocivil.gov.co/atencion/estadisticas-de-las-actividades aeronauticas/bases-de-dato | spa |
| dc.relation.references | Bergmeir, C., & Benítez, J. M. (2012). On the use of cross-validation for time series predictor evaluation. Information Sciences, 191, 192–213. https://doi.org/10.1016/J.INS.2011.12.028 | spa |
| dc.relation.references | Dickey, D. A., & Fuller, W. A. (1979). Distribution of the Estimators for Autoregressive Time Series With a Unit Root. Journal of the American Statistical Association, 74(366), 427. https://doi.org/10.2307/2286348 | spa |
| dc.relation.references | Dickey, D. G. (2011). Dickey-Fuller Tests. International Encyclopedia of Statistical Science, 385–388. https://doi.org/10.1007/978-3-642-04898-2_210 | spa |
| dc.relation.references | Donate, J. P., Cortez, P., Sánchez, G. G., & De Miguel, A. S. (2013). Time series forecasting using a weighted cross-validation evolutionary artificial neural network ensemble. Neurocomputing, 109, 27–32. | spa |
| dc.relation.references | El Aeropuerto El Dorado continúa recibiendo premios por esta razón | Infraestructura | Economía | Portafolio. (n.d.). Retrieved March 22, 2025, from https://www.portafolio.co/economia/infraestructura/el-aeropuerto-el-dorado continua-recibiendo-premios-por-esta-razon-623809 | spa |
| dc.relation.references | Forecasting: principles and practice - Rob J Hyndman, George Athanasopoulos - Google Libros. (n.d.). Retrieved March 22, 2025, from https://books.google.com.co/books?hl=es&lr=&id=_bBhDwAAQBAJ&oi=fnd&pg=PA7 &dq=10.+Hyndman,+R.+J.,+%26+Athanasopoulos,+G.+(2018).+Forecasting:+Principl es+and+Practice+(2nd+ed.).+OTexts.&ots=TjiXAkTPLL&sig=QXHDvy8FJ9GvKKjFvnFw XXV3yxQ#v=onepage&q&f=false | spa |
| dc.relation.references | Guimarães, M., Soares, C., & Ventura, R. (2022). Decision Support Models for Predicting and Explaining Airport Passenger Connectivity From Data. IEEE Transactions on Intelligent Transportation Systems, 23(9), 16005–16015. https://doi.org/10.1109/TITS.2022.3147155 | spa |
| dc.relation.references | Harris, R. I. D. (1992). Testing for unit roots using the augmented Dickey-Fuller test: Some issues relating to the size, power and the lag structure of the test. Economics Letters, 38(4), 381–386. https://doi.org/10.1016/0165-1765(92)90022-Q | spa |
| dc.relation.references | Hyndman, R. J., & Khandakar, Y. (2008). Automatic Time Series Forecasting: The forecast Package for R. Journal of Statistical Software, 27(3), 1–22. https://doi.org/10.18637/JSS.V027.I03 | spa |
| dc.relation.references | Hyndman, R., Koehler, A., Ord, K., & Snyder, R. (2008). Forecasting with Exponential Smoothing. https://doi.org/10.1007/978-3-540-71918-2 | spa |
| dc.subject | Modelos predictivos | spa |
| dc.subject | estadística | spa |
| dc.subject | python | spa |
| dc.subject | analitica de datos | spa |
| dc.subject | series de tiempo | spa |
| dc.subject | validación cruzada | spa |
| dc.subject.keyword | Predictive models | spa |
| dc.subject.keyword | Statistics | spa |
| dc.subject.keyword | Python | spa |
| dc.subject.keyword | Data analytics | spa |
| dc.subject.keyword | Time series | spa |
| dc.subject.keyword | Cross-validation | spa |
| dc.subject.lemb | Aeropuertos -- Administración | |
| dc.subject.lemb | Transporte aéreo de pasajeros | |
| dc.subject.lemb | Redes neuronales (Computación) | |
| dc.title | Modelado predictivo del flujo de pasajeros en el aeropuerto el dorado usando sarima, arima y lstm (1996–2024) | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_2df8fbb1 | spa |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 62b7a41a-cabb-4bd9-8ac6-c7fa279941ec | |
| relation.isAdvisorOfPublication.latestForDiscovery | 62b7a41a-cabb-4bd9-8ac6-c7fa279941ec |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Erika Beltrán Trabajo De Grado .pdf
- Tamaño:
- 2.22 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis
Bloque de licencias
1 - 2 de 2
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 2.87 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
Cargando...
- Nombre:
- FOR-EFE-GDB-007_AUTORIZACION_DE_PUBLICACION_DE_TESIS_O_TRABAJO_DE_GRADO_IG2 (1).pdf
- Tamaño:
- 130.79 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Carta de autorización
