RefDataCleaner: A usable data cleaning tool
Ver/
Fin embargo:
Fin embargo:
Fin embargo:
Fecha
2019Autor
Leon-Medina, Juan Carlos
Director(es)
Galpin, I.
Documentos PDF
Resumen
En este documento, llevamos a cabo un experimento para comparar el rendimiento del usuario al limpiar datos utilizando dos herramientas: RefDataCleaner, una herramienta web que creamos para detectar y corregir errores en archivos de datos estructurados y semiestructurados, y Microsoft Excel, una aplicación de hoja de cálculo de uso generalizado en organizaciones de todo el mundo, utilizada para diversos tipos de tareas, incluida la limpieza de datos. Con RefDataCleaner, un usuario especifica reglas para detectar y corregir errores de datos, utilizando valores o recuperándolos desde un archivo de datos de referencia. Comparado con Microsoft Excel, un usuario no experto puede limpiar los datos especificando fórmulas y aplicando las funciones de buscar/reemplazar.
Resumen en idioma extranjero
In this paper, we carry out an experiment to compare user performance when cleaning data using two contrasting tools: RefDataCleaner, a bespoke web-based tool that we created specifically for detecting and fixing errors in structured and semi-structured data files, and Microsoft Excel, a spreadsheet application in widespread use in organizations throughout the world which is used for diverse types of tasks, including data cleaning. With RefDataCleaner, a user specifies rules to detect and fix data errors, using hard-coded values or by retrieving values from a reference data file. In contrast, with Microsoft Excel, a non-expert user may clean data by specifying formulae and applying find/replace functions.
Palabras clave
Discusión de datos; Limpieza de datosColecciones
Estadísticas Google Analytics
Comentarios
Respuesta Comentario Repositorio Expeditio
Gracias por tomarse el tiempo para darnos su opinión.