Dashboard interactivo con modelo de red neuronal LSTM para la segmentación y análisis de la población afectada por infección respiratoria aguda grave (IRAG) en Bogotá

dc.contributor.advisorFranco Calderón, José Alejandro
dc.creatorBaquero Criollo, Diego Alejandro
dc.creatorSabogal Suarez, Cristian Felipe
dc.date.accessioned2025-12-12T13:54:44Z
dc.date.created2025-10-14
dc.description.abstractEste documento de trabajo presenta un sistema de monitoreo epidemiológico para la Infección Respiratoria Aguda Grave (IRAG) en Bogotá. Este sistema integra la depuración y el análisis exploratorio de 71.326 registros del SIVIGILA-INS (2018-2023) con un modelo predictivo basado en una red neuronal multicapa LSTM. Tras comparar árboles de decisión y bosques aleatorios con datos de series temporales semanales enriquecidos con variables demográficas y componentes estacionales seno-coseno, el LSTM (optimizado con normalización, abandono y detención temprana) ofreció el mejor equilibrio entre ajuste y generalización. El modelo proyecta aproximadamente 5.000 casos para 2024-2025, concentrados (60%) en poblaciones vulnerables y (67%) en estratos socioeconómicos más bajos, con un pico de casos desplazándose hacia bebés y adultos jóvenes. Los resultados se despliegan en un tablero interactivo de Power BI que permite la segmentación por año, sexo, grupo de edad, estrato socioeconómico y vulnerabilidad, proporcionando evidencia clara para priorizar intervenciones de salud y reducir las desigualdades en salud pública.
dc.description.abstractenglishThis work paper presents an epidemiological monitoring system for Severe Acute Respiratory Infection (SARI; or Infección Respiratoria Aguda Grave, IRAG) in Bogotá that integrates the cleansing and exploratory analysis of 71.326 SIVIGILA-INS records (2018-2023) with a predictive model based on multilayer LSTM neural network. After benchmarking decision trees and random forests on weekly time-series data enriched with demographic variables and sine–cosine seasonal components, the LSTM (optimized with normalization, dropout, and early stopping) offered the best balance between fit and generalization. The model projects approximately 5.000 cases for 2024-2025, concentrated (60%) in vulnerable populations and (67%) in lower socioeconomic strata, with the peak shifting toward infants and young adults. Results are deployed in an interactive Power BI dashboard that enables segmentation by year, sex, age group, socioeconomic stratum, and vulnerability, providing clear evidence to prioritize health interventions and reduce public-health inequalities.
dc.format.extent14 páginas
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://hdl.handle.net/20.500.12010/38647
dc.language.isoes
dc.relation.referencesS. Aragón, “Perfil Clínico y Epidemiológico de los Pacientes con Diagnóstico de Neumonía Viral Incluidos en la Vigilancia Centinela del Hospital Nacional de Niños Benjamín Bloom, de enero 2014 a diciembre 2015”, Universidad de El Salvador, 2018. Consultado: el 6 de enero de 2025. [En línea]. Disponible en: https://docs.bvsalud.org/biblioref/2021/04/1177388/491-11105864.pdf
dc.relation.referencesE. Rojas y S. Aguilar, “Minería de Datos para el Descubrimiento de Patrones en Enfermedades Respiratorias en Bogotá, Colombia”, Universidad Católica de Colombia, Bogotá D.C, 2017. Consultado: el 6 de enero de 2025. [En línea]. Disponible en: https://repository.ucatolica.edu.co/server/api/core/bitstreams/671a216d-16f5-4ba7-a154-e2c0fb849202/content
dc.relation.referencesCarlos Guerrero, “Implementar un Modelo Estadístico para el Estudio de las Enfermedades Endémicas y Crónicas Atendidas en el Hospital San Juan de Dios del Municipio de Pamplona, Norte de Santander”, Universidad de Pamplona, 2016. Consultado: el 6 de enero de 2025. [En línea]. Disponible en: http://repositoriodspace.unipamplona.edu.co/jspui/bitstream/20.500.12744/1861/1/Guerrero_2016_TG.pdf
dc.relation.referencesB. Del Rosario, M. Valdés, J. Díaz, L. Duany, L. Santeiro, y S. Del Villar, “Caracterización del Comportamiento de las Infecciones Respiratorias Agudas. Provincia Cienfuegos. Primer Trimestre 2020”. Consultado: el 6 de enero de 2025. [En línea]. Disponible en: https://www.redalyc.org/journal/1800/180065014011/html/#B1
dc.relation.referencesD. Carolina, M. Sánchez, S. Milena, y A. Fuentes, “Informe de Evento Infección Respiratoria Aguda, Colombia, 2020”, pp. 1–28, 2020.
dc.relation.referencesA. En, M. De, A. E. El, y M. De Valledupar, “Estudio sobre la Morbimortalidad por Infección Respiratoria Carmenza González Fermín Leguizamo Marisela López Montilla Yesenia Patricia Ponce Hilvar Yamid Malaver Universidad Nacional Abierta y a Distancia Escuela de Ciencias Básicas, Tecnología e Ingeniería”, pp. 1–31, 2010.
dc.relation.referencesA. de Ruvo et al., “Spread: Spatiotemporal Pathogen Relationships and Epidemiological Analysis Dashboard”, Vet Ital, vol. 60, núm. 4 Special Issue, pp. 1–13, mar. 2024, doi: 10.12834/VetIt.3476.23846.1.
dc.relation.referencesK. Footer et al., “Using Publicly Available, Interactive Epidemiological Dashboards: An Innovative Approach to Sharing Data from the Rakai Community Cohort Study”, JAMIA Open, vol. 7, núm. 3, oct. 2024, doi: 10.1093/jamiaopen/ooae069.
dc.relation.referencesC. P. Yadav y A. Sharma, “National Institute of Malaria Research-Malaria Dashboard (NIMR-MDB): a Digital Platform for Analysis and Visualization of Epidemiological Data”, The Lancet Regional Health - Southeast Asia, vol. 5, p. 100030, 2022, doi: 10.1016/j.
dc.relation.referencesJ. Leiner et al., “Machine Learning-Derived Prediction of In-Hospital Mortality in Patients with Severe Acute Respiratory Infection: Analysis of Claims Data from the German-Wide Helios Hospital Network”, Respir Res, vol. 23, núm. 1, dic. 2022, doi: 10.1186/s12931-022-02180-w.
dc.relation.referencesS. Albrecht et al., “Forecasting Severe Respiratory Disease Hospitalizations Using Machine Learning Algorithms”, BMC Med Inform Decis Mak, vol. 24, núm. 1, dic. 2024, doi: 10.1186/s12911-024-02702-0.
dc.relation.referencesA. Duarte Da Silva, M. Ferreira Da Costa Gomes, T. S. Gregianini, L. G. Martins, A. B. Gorini Da Veiga, y C. A. D. Silva, “Machine Learning in Predicting Severe Acute Respiratory Infection Outbreaks”, Cad. Saúde Pública, vol. 40, núm. 1, p. 122823, 2024, doi: 10.1590/0102-311XEN122823.
dc.relation.referencesC. González-Uribe et al., “A Mixed-Methods Study on the Design of Artificial Intelligence and Data Science-Based Strategies to Inform Public Health Responses to COVID-19 in Different Local Health Ecosystems: A Study Protocol for COLEV [Version 1; Peer Review: 1 Approved, 2 Approved with Reservations]”, 2022, doi: 10.12688/f1000research.110958.1.
dc.relation.referencesA. En, M. De, A. E. El, y M. De Valledupar, “Estudio Sobre La Morbimortalidad Por Infección Respiratoria Carmenza González Fermín Leguízamo Marisela López Montilla Yesenia Patricia Ponce Hilvar Yamid Malaver Universidad Nacional Abierta Y A Distancia Escuela De Ciencias Básicas, Tecnología E Ingeniería”.
dc.relation.referencesInstituto Nacional del Cáncer, “Mortalidad”, Instituto Nacional del Cáncer. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.cancer.gov/espanol/publicaciones/diccionarios/diccionario-cancer/def/mortalidad
dc.relation.referencesGoogle Cloud, “¿Qué es la Inteligencia Artificial o IA?” Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://cloud.google.com/learn/what-is-artificial-intelligence?hl=es-419
dc.relation.referencesIBM, “¿Qué es un Modelo de IA?”, IBM. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.ibm.com/es-es/topics/ai-model
dc.relation.referencesIBM, “¿Qué es la Agrupación en Clústeres K-Means?”, K-Means Clustering. Consultado: el 12 de marzo de 2025. [En línea]. Disponible en: https://www.ibm.com/mx-es/topics/k-means-clustering
dc.relation.referencesIBM, “¿Qué es el Bosque Aleatorio?”, Artificial Intelligence. Consultado: el 12 de marzo de 2025. [En línea]. Disponible en: https://www.ibm.com/mx-es/think/topics/random-forest
dc.relation.referencesSalesforce, “Dashboard: ¿Cómo Crear Uno para tu Estrategia?”, Salesforce Latam. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.salesforce.com/mx/blog/dashboard/
dc.relation.referencesGoogle Cloud, “¿Qué es el Procesamiento del Lenguaje Natural?”, PLN. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://cloud.google.com/learn/what-is-natural-language-processing?hl=es
dc.relation.referencesIBM, “¿Qué es una Red Neuronal?”, neural networks. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://www.ibm.com/mx-es/topics/neural-networks
dc.relation.referencesesri, “Cómo Funciona el Algoritmo XGBoost”. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://pro.arcgis.com/es/pro-app/latest/tool-reference/geoai/how-xgboost-works.htm#:~:text=XGBoost%20es%20la%20abreviatura%20de,aleatorio%20y%20refuerzo%20de%20gradientes.
dc.relation.referencesAWS, “¿Qué es una Interfaz de Programación de Aplicaciones (API)?” Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://aws.amazon.com/es/what-is/api/#:~:text=API%20significa%20%E2%80%9Cinterfaz%20de%20programaci%C3%B3n,de%20servicio%20entre%20dos%20aplicaciones.
dc.relation.referencesFunción Pública, “Organigrama Sector de Estadística”, jul. 2021.
dc.relation.referencesE. Inmunoprevenibles et al., “Documento Elaborado por”, 2017.
dc.relation.referencesLIS Data Solutions, “¿Qué es RapidMiner?” Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://www.lisdatasolutions.com/es/que-es-rapidminer/
dc.relation.referencesInstituto Nacional de Salud, “SIVIGILA”, INS. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://www.ins.gov.co/Direcciones/Vigilancia/Paginas/SIVIGILA.aspx
dc.relation.referencesSistema Integrado de Información de la Proyección Social, “¿Qué es SISPRO?”, SISPRO. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://www.sispro.gov.co/Pages/Home.aspx
dc.relation.references“Software IBM SPSS”. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.ibm.com/es-es/spss
dc.relation.referencesE. M. Cáceres, F. P. Moya, D. A. Á. Concepción, y L. M. Cáceres, “Sistema de Gestión para la Información de los Canales Endémicos”, Revista Cubana de Tecnología de la Salud, vol. 12, núm. 2, pp. 40–49, may 2021, Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://revtecnologia.sld.cu/index.php/tec/article/view/1921
dc.relation.references"Definición de SARS-CoV-2 - Diccionario de Cáncer del NCI - NCI”. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.cancer.gov/espanol/publicaciones/diccionarios/diccionario-cancer/def/sars-cov-2
dc.relation.referencesM. Silva et al., “chewBBACA: A complete suite for gene-by-gene schema creation and strain identification”, Microb Genom, vol. 4, núm. 3, mar. 2018, doi: 10.1099/MGEN.0.000166.
dc.relation.references“¿Qué es SQL? - Explicación de Lenguaje de Consulta Estructurado (SQL) - AWS”. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://aws.amazon.com/es/what-is/sql/
dc.relation.references“¿Qué es Tableau?” Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.tableau.com/es-es/why-tableau/what-is-tableau
dc.relation.references“Glosario | HIPAA”. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://start.docuware.com/es/glosario-de-terminos/hipaa
dc.relation.references“SHAP, una Librería de Python para la Interpretabilidad de Modelos de Machine Learning | by Skillsbox | Medium”. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://medium.com/@Skillsbox/shap-una-liberia-de-python-para-la-interpretabilidad-de-modelos-de-machine-learning-d111c4bed8a8
dc.relation.references“AUC y Curva ROC en Aprendizaje Automático | DataCamp”. Consultado: el 26 de enero de 2025. [En línea]. Disponible en: https://www.datacamp.com/es/tutorial/auc
dc.relation.referencesO. Shchur et al., “AutoGluon–TimeSeries: AutoML for Probabilistic Time Series Forecasting”, 2023. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://www.amazon.science/publications/autogluon-timeseries-automl-for-probabilistic-time-series-forecasting
dc.relation.references“Una Exploración en Profundidad de los Transformadores de Fusión Temporal para la Predicción de Series Temporales | por Mirza Samad | AI Simplified in Plain English | Medium”. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://medium.com/ai-simplified-in-plain-english/an-in-depth-exploration-of-temporal-fusion-transformers-for-time-series-forecasting-91e74040a079
dc.relation.referencesD. Salinas, V. Flunkert, J. Gasthaus, y T. Januschowski, “DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks”, Int J Forecast, vol. 36, núm. 3, pp. 1181–1191, abr. 2017, doi: 10.1016/j.ijforecast.2019.07.001.
dc.relation.references“¿Qué es el Modelo SARIMA? | Técnicas de Trading”. Consultado: el 27 de enero de 2025. [En línea]. Disponible en: https://www.tecnicasdetrading.com/2024/07/modelo-sarima.html
dc.relation.referencesA. Baquero y C. Sabogal, “IA IRAG EN BOGOTÁ”. Consultado: el 1 de junio de 2025. [En línea]. Disponible en: https://dashboard-irag.github.io/IA-IRAG/
dc.subjectRedes Neuronales LSTM (Long Short-Term Memory)
dc.subjectDashboard Interactivo
dc.subjectInfección Respiratoria Aguda Grave (IRAG)
dc.subjectPower BI
dc.subjectPredicción Epidemiológica
dc.subject.keywordLSTM neural networks
dc.subject.keywordInteractive dashboard
dc.subject.keywordInfección Respiratoria Aguda Grave (IRAG)
dc.subject.keywordPower BI
dc.subject.keywordEpidemiological prediction
dc.subject.lembVigilancia epidemiológica
dc.subject.lembInfecciones respiratorias agudas - Análisis estadístico
dc.subject.lembSalud pública - Apoyo a la toma de decisiones
dc.titleDashboard interactivo con modelo de red neuronal LSTM para la segmentación y análisis de la población afectada por infección respiratoria aguda grave (IRAG) en Bogotá
dc.type.coarhttp://purl.org/coar/resource_type/c_2df8fbb1

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Dashboard Interactivo con Modelo de Red Neuronal LSTM para la Segmentación y Análisis de la Población Afectada por Infección Respiratoria Aguda Grave (IRAG) en Bogotá.pdf
Tamaño:
1.16 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.28 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
Cargando...
Miniatura
Nombre:
FOR-EFE-GDB-007_AUTORIZACION_DE_PUBLICACION_DE_TESIS_O_TRABAJO_DE_GRADO.pdf
Tamaño:
368.83 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta de autorización