Maestría en Ingeniería y Analítica de Datoshttp://hdl.handle.net/20.500.12010/84962024-03-19T11:31:09Z2024-03-19T11:31:09ZPredicción del precio del bitcoin a partir de modelos supervisadoshttp://hdl.handle.net/20.500.12010/340732024-03-14T15:01:53ZPredicción del precio del bitcoin a partir de modelos supervisados
Las criptomonedas, lideradas por el Bitcoin, han ganado popularidad global como medios de transacción seguros y eficientes. Aunque su aceptación varía entre países, lugares como El Salvador, Estados Unidos y Canadá ya las aceptan en comercios importantes. Plataformas como Coinbase y Binance facilitan su intercambio, mientras que el análisis estadístico y el aprendizaje automático son herramientas clave para entender y predecir su volatilidad. En Colombia, aunque aún no reguladas, algunos comercios aceptan criptomonedas, y se han iniciado proyectos piloto para evaluar su viabilidad. La tesis propone un análisis que abarca desde modelos estadísticos clásicos hasta técnicas de redes neuronales para predecir el precio del Bitcoin. Se sigue la metodología CRISP-DM, aunque la fase de transformación de la información no fue incluida en este estudio.
Predicción de costos de proyectos gubernamentales en Colombia : combinación de enfoques basados en regresión y minería de textos para análisis predictivoshttp://hdl.handle.net/20.500.12010/340722024-03-14T15:00:59ZPredicción de costos de proyectos gubernamentales en Colombia : combinación de enfoques basados en regresión y minería de textos para análisis predictivos
Comprender los costos proyectados de los proyectos dentro de diversos sectores de un país es crucial para la asignación de recursos y la entrega oportuna. En Colombia, se puede acceder a datos completos de proyectos gubernamentales a través de la plataforma de datos abiertos del Gobierno Nacional. Utilizando estos conjuntos de datos del Departamento Nacional de Planeación, construimos un modelo predictivo que aprovecha el análisis de regresión para estimar los gastos asociados con las iniciativas gubernamentales.
Se evalúan múltiples modelos de regresión para determinar cuál es el más eficaz para la implementación, utilizando diversas métricas de error de evaluación. Al combinar variables descriptivas en una variable unificada, aplicamos dos técnicas de minería de texto para discernir las variables más influyentes para su integración en los modelos predictivos. Al final, el modelo Adaboost combinado con TF-IDF surgió como la combinación de modelos más precisa, mostrando un error de precisión promedio (MAPE) del 17,6%, seguido de cerca por el modelo Random Forest combinado con TF-IDF con un MAPE de 17,9%.
Identifying public tenders of interest using
classification models : a comparative analysishttp://hdl.handle.net/20.500.12010/340702024-03-14T15:01:14ZIdentifying public tenders of interest using
classification models : a comparative analysis
Uno de los principales retos a los que se enfrentan muchas entidades está relacionado con la obtención de recursos financieros. Una opción atractiva es ofrecer servicios o productos dirigidos a entidades del sector público. El sector público está integrado por entidades estatales que contratan sus diferentes requerimientos a través de licitaciones públicas. En Colombia, la Agencia Nacional de Contrataciones Públicas – Colombia Compra Eficiente (ANCP–CCE), es la entidad encargada de gestionar los procesos de licitación pública en Colombia a través de la base de datos SECOP II. Sus supuestos objetivos son garantizar una mayor eficiencia, transparencia y optimización de los recursos estatales. SECOP II es una plataforma virtual transaccional que permite tanto a proveedores como a oferentes realizar el proceso de contratación en esta plataforma.
La Universidad Minuto de Dios en Colombia es una, entre muchas entidades, que busca obtener recursos estatales a través de licitaciones públicas. Esta entidad deberá realizar un proceso de identificación y validación al momento de presentar las ofertas que se publican en la plataforma Colombia Compra Eficiente SECOP II. Realizar este proceso supone un esfuerzo importante debido a que es un proceso manual y repetitivo para cada oferta, lo que implica invertir tiempo y recursos económicos a la hora de identificar las ofertas de interés. Los datos relacionados con licitaciones públicas son una fuente importante de información de datos abiertos, lo que genera una gran oportunidad para el desarrollo de modelos orientados a la analítica. En Colombia, los avances y las investigaciones en el campo de las compras públicas han sido limitados y se han centrado principalmente en el análisis de datos descriptivos. Como tal, se postula que incursionar en el desarrollo de modelos de aprendizaje automático presenta una solución potencialmente eficiente para las necesidades de dichas entidades.
Existen algunas empresas privadas que ofrecen servicios a través de plataformas de consulta para buscar licitaciones. Las empresas más reconocidas son Licitaciones colombia.co y Licitaciones al día, que identifican oportunidades de financiamiento público. Estos brindan herramientas que permiten identificar oportunidades de financiamiento tanto público como privado, utilizando filtros simples como temática, ubicación geográfica y tipo de financiamiento. Sin embargo, ninguna de estas empresas ofrece modelos personalizados, hechos a medida y que se ajusten a los requerimientos específicos de cada entidad. Como tales, estos enfoques no simplifican significativamente el proceso operativo de búsqueda de ofertas.
En este trabajo se realiza un análisis comparativo entre diferentes modelos de clasificación con el objetivo de identificar el mejor modelo que pueda clasificar licitaciones de interés para la Universidad Minuto de Dios. En este análisis, se evalúan cinco técnicas de clasificación: (1) Regresión logística, (2) Árboles de decisión (3) Bosque aleatorio, (4) Aumento de gradiente y (5) AdaBoost. Para el conjunto de datos analizado se aplican tres técnicas diferentes de balanceo de datos para determinar el comportamiento de los modelos según cada caso. Las técnicas utilizadas en este estudio son: (a) submuestreo aleatorio, (b) NearMiss y (c) remuestreo avanzado combinado equilibrio SMOTE-Tomek.
La estructura de este trabajo es la siguiente: La sección “ Trabajos relacionados ” presenta un repaso de los trabajos relacionados con la contratación pública y la identificación de licitaciones de interés. Las secciones siguientes siguen en términos generales los pasos de la metodología CRISP-DM ampliamente utilizada. La sección " Comprensión empresarial " describe las necesidades comerciales y la sección " Comprensión de datos " describe el conjunto de datos subyacente obtenido de la plataforma SECOP-II. La sección " Preparación de datos " se centra en los pasos llevados a cabo para la preparación de datos. El proceso de modelado se describe en las secciones " Modelado " y " Evaluación " presenta la evaluación y los resultados de los modelos seleccionados para permitir la selección del algoritmo de clasificación de mejor rendimiento para su implementación. En la sección " Discusión " se presenta la discusión y análisis detallado de los resultados obtenidos, y finalmente en la sección " Conclusiones " se concluye.
Diseño e implementación de un modelo de predicción de retiros de la policía nacional de Colombia mediante una muestra poblacional de la policía metropolitana de Bogotáhttp://hdl.handle.net/20.500.12010/340682024-03-14T14:57:58ZDiseño e implementación de un modelo de predicción de retiros de la policía nacional de Colombia mediante una muestra poblacional de la policía metropolitana de Bogotá
El retiro del empleo es una fase implícita dentro del desarrollo de la vida
laboral, pero que también provoca diferentes consecuencias cuando este no
se ajusta a los ciclos y dinámicas preestablecidas, sino que responde a otras
situaciones que modifican la planeación inicial, incidiendo igualmente en los
objetivos de la organización. En la Policía Nacional la situación es más difícil,
teniendo en cuenta que la misionalidad asignada a esta institución requiere de
la disponibilidad de un número considerable de efectivos y la solicitud de retiro
anticipado de sus integrantes sin duda, afecta directamente la ejecución de
sus funciones y la cobertura de las expectativas de los ciudadanos en torno a
su servicio.
Para la toma de decisiones del mando en la Policía Nacional y en la generación
de estrategias de fidelización (retención del talento humano) de uniformados
en la policía nacional, se hace necesario establecer parámetros de análisis
que permitan tener herramientas objetivas que muestren resultados
evaluables a corto y mediano plazo.