Show simple item record

dc.contributor.advisorBedoya, Olmer García
dc.coverage.spatialColombia
dc.creatorMorales Dussan, Sergio
dc.date.accessioned2022-07-18T15:04:23Z
dc.date.available2022-07-18T15:04:23Z
dc.date.created2021
dc.identifier.urihttp://hdl.handle.net/20.500.12010/27644
dc.description.abstractEn este trabajo, se evalúa la capacidad de varios modelos de aprendizaje automático para clasificar a los estudiantes según vivan o no en un área metropolitana, utilizando datos de comportamiento de los estudiantes obtenidos de los registros de Moodle de una Universidad de educación a distancia en Antioquia, Colombia. Usando F1-score, la métrica que se consideró como la mas adecuada dada la naturaleza desequilibrada de los datos, se encontró que el algoritmo del árbol de decisión XGBoost produce el mejor rendimiento de clasificación. El alto desempeño de los algoritmos de clasificación evaluados confirma la brecha digital urbano rural prevalente en Colombia, así como también permite inferir las relaciones que existen en la variables que hace que los algoritmos tomen una decisión de clasificar en área metropolitana o no metropolitana a un estudiante. Los resultados de este trabajo pueden permitir que un entorno de aprendizaje inteligente se ajuste de forma adaptativa a las competencias y necesidades especificas de los alumnos en función de sus características socio-económicas.spa
dc.format.extent40 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.publisherUniversidad de Bogotá Jorge Tadeo Lozanospa
dc.sourcereponame:Expeditio Repositorio Institucional UJTL
dc.sourceinstname:Universidad de Bogotá Jorge Tadeo Lozano
dc.subjectModelos de clasificaciónspa
dc.titleModelos de clasificación supervisados de zonas metropolitanas y no metropolitanas en estudiantes de educación virtual por medio de la plataforma Moodlespa
dc.type.localTrabajo de grado de maestría
dc.subject.lembProgramación (Computadores electrónicos) -- Tesis y disertaciones académicasspa
dc.subject.lembProcesamiento electrónico de datos -- Tesis y disertaciones académicasspa
dc.subject.lembEducación en línea -- Tesis y disertaciones académicasspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.rights.localAbierto (Texto Completo)spa
dc.creator.degreeMagíster en Modelado y Simulación
dc.publisher.programMaestría en Modelado y Simulación MM&S
dc.relation.referencesAl-Radaideh, Q. A., Al-Shawakfa, E. M., and Al-Najjar, M. I. (2006). Mining student data using decision trees. In International Arab Conference on Information Technology (ACIT'2006), Yarmouk University, Jordan, pages 1{5.spa
dc.relation.referencesBaradwaj, B. K. and Pal, S. (2012). Mining educational data to analyze students' performance. arXiv preprint arXiv:1201.3417.spa
dc.relation.referencesBerrio-Zapata, C. and Rojas-Hern andez, H. (2014). The digital divide in the university: The appropriation of ict in higher education students from bogota, colombia. Comunicar, 22(43):133{ 142.spa
dc.relation.referencesCanales, A. and De los R os, D. (2007). Factores explicativos de la deserci on universitaria. Calidad en la Educaci on.spa
dc.relation.referencesC ardenas Liebethal, J. A. et al. (2019). Predicci on de potenciales clientes de inmuebles para Aitu e, basado en datos hist oricos de sus clientes. PhD thesis, Universidad de Concepci on. Facultad de Ingenier a. Departamento de . . . .spa
dc.relation.referencesChen, T. and Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 785{794.spa
dc.relation.referencesChen, T., He, T., Benesty, M., Khotilovich, V., and Tang, Y. (2015). Xgboost: extreme gradient boosting. R package version 0.4-2, pages 1{4.spa
dc.relation.referencesCortes, C. and Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3):273{297.spa
dc.relation.referencesCox, D. R. (1958). The regression analysis of binary sequences. Journal of the Royal Statistical Society: Series B (Methodological), 20(2):215{232.spa
dc.relation.referencesde Estudios Urbanos, I. (2016). Dinamicas de las Areas Metropolitanas de Colombia. Universidad Nacional de Colombia, Sede Bogot a.spa
dc.relation.referencesDetoni, D., Cechinel, C., Matsumura, R. A., and Brauner, D. F. (2016). Learning to identify atrisk students in distance education using interaction counts. Revista de Inform atica Te orica e Aplicada, 23(2):124{140.spa
dc.relation.referencesDicovskiy Riob oo, L. M. and Pedroza, M. E. (2018). Miner a de datos, una innovaci on de los m etodos cuantitativos de investigaci on, en la medici on del rendimiento acad emico universitario. Revista Cient ca de FAREM-Estel , (24):143{152.spa
dc.relation.referencesFormia, S., Lanzarini, L. C., and Hasperu e, W. (2013). Caracterizaci on de la deserci on universitaria en la UNRN utilizando Miner ade Datos. Revista Iberoamericana de Educaci on en Tecnolog a y Tecnolog a en Educaci on, 11:92{98.spa
dc.relation.referencesFushiki, T. (2011). Estimation of prediction error by using k-fold cross-validation. Statistics and Computing, 21(2):137{146.spa
dc.relation.referencesGarc a Jim enez, V. (2010). Distribuciones de Clases No Balanceadas: M etricas, An alisis de Complejidad y Algoritmos de Aprendizaje. TDX (Tesis Doctorals en Xarxa).spa
dc.relation.referencesGil, H. A. P., Castro, K. A. C., Berm udez, G. M. T., et al. (2017). La brecha digital en colombia: Un an alisis de las pol ticas gubernamentales para su disminuci on. Redes De Ingenier a, .:59{71.spa
dc.relation.referencesGonz alez, F. A. (2015). Modelos de aprendizaje computacional en reumatologia. Revista Colombiana de Reumatologia, 22(2):77{78.spa
dc.relation.referencesHorvat, A., Dobrota, M., Krsmanovic, M., and Cudanov, M. (2015). Student perception of Moodle learning management system: a satisfaction and signi cance analysis. Interactive Learning Environments, 23(4):515{527.spa
dc.relation.referencesLlorente-Cejudo, M. d. C. (2007). Moodle como entorno virtual de formaci on al alcance de todos. Comunicar: Revista Cient ca de Comunicaci on y Educaci on, 14(28):197{202.spa
dc.relation.referencesLopez, M. I., Luna, J. M., Romero, C., and Ventura, S. (2012). Classi cation via clustering for predicting nal marks based on student participation in forums. International Educational Data Mining Society.spa
dc.description.hashtag#Modeladospa
dc.description.rda1 recurso en línea (archivo de texto)
dc.description.abstractenglishIn this paper, we evaluate the ability of various machine learning models to classify students ac cording to whether they live in a metropolitan area or not, using student behavior data obtained from Moodle logs obtained from a distance learning University in Antioquia, Colombia. UsingF1-score, the metric that we deem to be most suitable given the unbalanced nature of the data, we find that the XGBoost decision tree algorithm yields the best classification performance. The high performanceof the classification algorithms evaluated confirms the urban-rural digi-tal divide prevalent in Colombia. The findings of this work can enable a smart learning environment to adaptively adjust to specific learners’competencies and needs based on their socioeconomic characteristics.spa
dc.publisher.facultyFacultad de Ciencias Naturales e Ingeniería
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record