dc.coverage.spatial | Colombia | spa |
dc.creator | Chaparro Sáenz, Juan Sebastián | |
dc.date.accessioned | 2021-10-07T17:15:06Z | |
dc.date.available | 2021-10-07T17:15:06Z | |
dc.date.created | 2021 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12010/22137 | |
dc.description.abstract | This work proposes the development of a methodology that standardises the extraction, processing and analysis of natural language data for the study of gender-based violence evidenced on the Twitter social network. We develop a tool that may be exploited by different organisations, foundations, corporations, associations or state institutions that promote, exercise and disseminate human rights in Colombia and elsewhere. In this work, we take as a case study ten prominent female public figures in Colombia in the artistic, political and journalistic spheres. We extract a total of 39,629 tweet responses during a turbulent national strike amid the COVID-19 pandemic, and carry out topic identification and sentiment analysis. While we observe differences between the different roles based on natural language processing with different libraries, the are notable negative terms in the topics identified which are of concern as they mayincite gender-based violence. It is expected that this proposed tool will benefit the decision-making of these institutions to issue early warnings, together with the exercise of the protection, prevention and defence of women’s rights. | spa |
dc.format.extent | 15 páginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | eng | spa |
dc.publisher | Universidad de Bogotá Jorge Tadeo Lozano | spa |
dc.source | instname:Universidad de Bogotá Jorge Tadeo Lozano | spa |
dc.source | reponame:Expeditio Repositorio Institucional UJTL | spa |
dc.subject | Analítica de datos | spa |
dc.title | Analysing gender-based violence against colombian public figures on Twitter | spa |
dc.type.local | Trabajo de grado de maestría | spa |
dc.subject.lemb | Procesamiento electrónico de datos -- Tesis y disertaciones académicas | spa |
dc.subject.lemb | Sistemas de almacenamiento y recuperación de información -- Tesis y disertaciones académicas | spa |
dc.subject.lemb | Redes sociales en línea -- Tesis y disertaciones académicas | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.identifier.repourl | http://expeditio.utadeo.edu.co | spa |
dc.creator.degree | Magíster en Ingeniería y Analítica de Datos | spa |
dc.publisher.program | Maestría en Ingeniería y Analítica de Datos | spa |
dc.relation.references | U. Women, The world for women and girls annual report 2019-2020 (2020). | spa |
dc.relation.references | M. I. L. Vélez, L. M. E. Jaramillo, Derechos laborales y de la seguridad social para las mujeres en colombia en cumplimiento de la ley 1257 de 2008, Revista de Derecho (2015) 269–296. | spa |
dc.relation.references | D. D. Pueblo, Situación de las mujeres y personas con orientación sexual e identidad de género diversas, refugiadas y migrantes en colombia, Women’s rights (2021) 10. URL: https://www.defensoria.gov.co/public/pdf/Boletin_Situacion_Mujer_2020.pdf. | spa |
dc.relation.references | A. Oussous, F.-Z. Benjelloun, A. A. Lahcen, S. Belfkih, Big data technologies: A survey, Journal of King Saud University-Computer and Information Sciences 30 (2018) 431–448. | spa |
dc.relation.references | S. Kemp, 2020, Digital 2020: 3.8 billion people use social media, URL: https:// wearesocial.com/blog/2020/01/digital-2020-3-8-billion-people-use-social-media. | spa |
dc.relation.references | E. Van der Klashorst, S. Safarikova, Twitter as barometer of public opinion on the female athlete: The case of caster semenya, African Journal for Physical Activity and Health Sciences (AJPHES) 24 (2018) 649–658. | spa |
dc.relation.references | A. Khatua, E. Cambria, A. Khatua, Sounds of silence breakers: Exploring sexual violence on twitter, in: 2018 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), IEEE, 2018, pp. 397–400. | spa |
dc.relation.references | S. D. M. Dussan, M. Leon, O. Garcia-Bedoya, I. Galpin, Exploring the colombian digital divide using moodle logs through supervised learning, Interactive Technology and Smart Education (2021). | spa |
dc.relation.references | D. F. Martinez, J. N. Pacheco, L. F. Payan, F. C. Cepeda, Exploring the digital gender divide: Insights from the colombian case, IDIA2020 (2020) 69. | spa |
dc.relation.references | Y. M. Shum, 2020, Situación digital, internet y redes sociales colombia 2020, URL: https: //yiminshum.com/social-media-colombia-2020/. | spa |
dc.relation.references | R. Wirth, J. Hipp, Crisp-dm: Towards a standard process model for data mining, in: Proceedings of the 4th international conference on the practical applications of knowledge discovery and data mining, volume 1, Springer-Verlag London, UK, 2000. | spa |
dc.relation.references | S. Z. Cremades, Redes sociales para la prevención del suicidio juvenil, 3C TIC. Cuadernos de desarrollo aplicados a las TIC (2019) 54–69. | spa |
dc.relation.references | J. R. Saura, A. Reyes-Menéndez, P. Palos-Sanchez, Un análisis de sentimiento en twitter con machine learning: Identificando el sentimiento sobre las ofertas de# blackfriday, Revista Espacios 39 (2018). | spa |
dc.relation.references | J. C. Barriga Mariño, et al., Desarrollo y aplicación de una herramienta de extracción y almacenamiento de datos de twitter a un contexto social de violencia política, technology (2017). | spa |
dc.relation.references | R. Silva, et al., Detección de violencia verbal hacia las mujeres en redes sociales mediante técnicas de aprendizaje automático, technology (2019). | spa |
dc.relation.references | G. Evolvi, Hate in a tweet: Exploring internet-based islamophobic discourses, Religions 9 (2018) 307. | spa |
dc.relation.references | E. W. Pamungkas, V. Basile, V. Patti, Misogyny detection in twitter: a multilingual and cross-domain study, Information Processing & Management 57 (2020) 102360. | spa |
dc.relation.references | Google, 2021, Cloud firestore data model, URL: https://firebase.google.com/docs/firestore/ data-model. | spa |
dc.relation.references | G. A. García Vélez, Aplicación de la metodología crisp-dm a la recolección y análisis de datos georreferenciados desde twitter, technology (2018). | spa |
dc.relation.references | D. M. Blei, A. Y. Ng, M. I. Jordan, Latent dirichlet allocation, the Journal of machine Learning research 3 (2003) 993–1022. | spa |
dc.description.hashtag | #AnalíticaDeDatos | spa |
dc.description.abstractenglish | Este trabajo propone el desarrollo de una metodología que estandarice la extracción, procesamiento y análisis de datos en lenguaje natural para el estudio de la violencia de género evidenciada en la red social Twitter. Desarrollamos una herramienta que puede ser explotada por diferentes organizaciones, fundaciones, corporaciones, asociaciones o instituciones estatales que promueven, ejercen y difunden los derechos humanos en Colombia y otros lugares. En este trabajo, tomamos como caso de estudio diez destacadas figuras públicas femeninas en Colombia en los ámbitos artístico, político y periodístico. Extraemos un total de 39,629 respuestas de tweets durante una turbulenta huelga nacional en medio de la pandemia de COVID-19, y llevamos a cabo identificación de temas y análisis de sentimientos. Si bien observamos diferencias entre los diferentes roles basados en el procesamiento del lenguaje natural con diferentes bibliotecas, son notables términos negativos en los temas identificados que son motivo de preocupación ya que pueden incitar a la violencia de género. Se espera que esta herramienta propuesta beneficie la toma de decisiones de estas instituciones para emitir alertas tempranas, junto con el ejercicio de la protección, prevención y defensa de los derechos de las mujeres. | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_46ec | spa |