Prototipo de sistema de exploración y generación de Herramientas de análisis para datos de twitter
Date
2020Author
Novoa Triana, Tatiana
Magíster en Ingeniería y Analítica de Datos
Metadata
Show full item record
Documentos PDF
Abstract
nternet y las redes sociales han permitido a las personas comunicarse y expresarse libremente acerca de cualquier tema que se comparta por dichos medios. Con el pasar del tiempo y debido a la popularidad de muchas de estas redes sociales se empieza a observar que la información que se genera cada minuto es de tal magnitud que la tecnología misma para almacenarla y procesarla se empieza a ver limitada y se empieza a requerir de nuevas técnicas para ello, a este alto volumen de información es a lo que se le conoce como Big Data. Una de estas redes sociales es Twitter, aquí las personas pueden expresar sus opiniones sobre cualquier tema, incluso empresas usan esta red para conocer que piensan sus clientes acerca de los productos o servicios.
Este proyecto busca desarrollar una herramienta que permita generar algunos de los tantos análisis que se pueden generar a partir de esta información, entre ellos está el análisis de sentimiento, dicho análisis consiste en clasificar las opiniones de las personas en positivas, negativas o neutrales acerca del tema que se desea indagar. Para poder cumplir el objetivo y desarrollar la herramienta se utilizarán herramientas de código abierto, como es Spark para procesamiento paralelo de datos con Clústers, así como también Django, el cual es un framework de Python para desarrollo ágil de entornos web.
Summary in foreign language
Internet and social networks have allowed people to communicate and express themselves freely about any topic that is shared by users. Over time and due to the popularity of many of these social networks, we find that the information generated every minute of the day is of such magnitude that the technology to store and process seems to be limited and, as such, new techniques are required for such high volumes of information known as Big Data. One of these social networks is Twitter, there people can express their opinions on any topic, even companies use this network to know what their customers think about products or services.
This project seeks to develop a tool that allows generating some of the many analyses that can be generated from this information, among which is sentiment analysis. This analysis consists in classifying the opinions of people in positive, negative or neutral about the topic user want to investigate. In order to fulfill the objective and develop the tool, open-source libraries will be used, such as Spark for parallel data processing with clusters, as well as Django, which is a Python framework for agile development of Web environments.
Collections
Estadísticas Google Analytics
Comments
Respuesta Comentario Repositorio Expeditio
Gracias por tomarse el tiempo para darnos su opinión.