Arquitectura Medallón: análisis integral y aplicaciones

dc.description.abstractLa industria de los datos se encuentra en constante crecimiento. Según estadísticas recientes, cada día se generan aproximadamente 402,74 millones de Terabytes de información, y se estima que para el año 2025 la cifra alcance los 181 Zettabytes. Esto representa un aumento de 74 veces en solo 13 años, considerando que en 2010 apenas se producían 2 Zettabytes [1]. En este contexto, resulta fundamental que las empresas cuenten con especialistas capaces de diseñar soluciones de datos modernas y escalables, orientadas a ingestar, procesar/transformar, organizar y visualizar la información para facilitar la toma de decisiones. Para lograrlo, es necesario definir una arquitectura de datos que se adapte al manejo de grandes volúmenes, así como a la diversidad de formatos y estructuras que caracterizan a los datos actuales. En línea con lo anterior, se propone analizar la arquitectura Medallón, que al ser una arquitectura en capas es una de las más utilizadas actualmente por diversas empresas, especialmente en implementaciones sobre plataformas de computación en la nube o en el mundo de los Data Lakehouses o Data Lakes. Esta arquitectura organiza los datos en una secuencia lógica de mejora de calidad, estructurada en las etapas Bronce, Plata y Oro. Gracias a esta organización en capas, los datos sin procesar se transforman progresivamente en información valiosa, al tiempo que se fortalecen aspectos como el linaje de datos, la repetibilidad de procesos y el control de acceso [2] [3]. El objetivo de este trabajo es ofrecer una explicación general sobre qué es y cómo es la implementación de esta arquitectura Medallion, describiendo cada fase: ingesta de datos, almacenamiento, procesamiento y gobernanza, además de presentar algunos ejemplos de aplicación en función de distintos casos de uso.
dc.description.abstractenglishThe data industry is experiencing rapid and continuous growth. Recent statistics indicate that approximately 402.74 million terabytes of information are generated every day, and projections estimate that by 2025 global data volume will reach 181 zettaBytes. This represents a seventyfour-fold increase in only thirteen years, considering that in 2010 the world produced just 2 zettabytes. In this scenario, organizations increasingly require specialists capable of designing modern and scalable data solutions that enable the ingestion, processing, organization, and visualization of information to support strategic decision-making. Achieving this capability demands the definition of a data architecture that can efficiently manage large volumes of information, as well as the variety of formats and structures that characterize contemporary datasets [1]. In response to these needs, this work analyzes the Medallion Architecture, a layered architecture widely adopted by companies, particularly in cloud-based implementations and Data Lakehouse or Data Lake environments. The Medallion approach organizes data into a logical sequence of quality improvement through three stages—Bronze, Silver, and Gold. This layered structure enables raw data to be progressively transformed into high-value information while strengthening essential aspects such as data lineage, process repeatability, and access control [2] [3]. The objective of this study is to provide a comprehensive overview of the Medallion Architecture, including its conceptual foundation and practical implementation. It describes each stage of the data lifecycle—data ingestion, storage, processing, and governance—and presents illustrative examples aligned with different use cases. The analysis aims to highlight the bene fits and applicability of this architecture in modern data management.
dc.format.extent79 páginas.
dc.format.mimetypeapplication/pdf
dc.language.isoes
dc.relation.references[1] F. Duarte, Amount of Data Created Daily (2025), Disponible en: https : / / explodingtopics. com/ blog/ data-generated-per-day , 2025. visitado 13 de ago. de 2025.
dc.relation.references[2] B. Guntupalli, «ETL Architecture Patterns: Hub-and-Spoke, Lambda, and More,» International Journal of AI, BigData, Computational and Management Studies, págs. 61-71, 2023, Disponible en: https: // ijaibdcms. org/ index. php/ ijaibdcms/ article/ view/ 203/ 208 .
dc.relation.references[3] M. Wiselka, «Development of Modern Data Platform using Medallion Architecture,» Haaga-Helia University of Applied Sciences, Finlandia, inf. téc., 2024, Bachelor’s Thesis for Degree Programme in Business Information Technology Disponible en: https : // www. theseus. fi/ bitstream/ handle/ 10024/ 869487/ Wiselka_ Michal. pdf? sequence= 2& isAllowed= y .
dc.relation.references[4] V. Mayer-Schonberger y K. Cukier, Big data: La revolución de los datos masivos. Turner Publicaciones S.L., 2013, pág. 16, isbn: 978-84-15832-10-2. dirección: https://books. google.cl/books?hl=es&lr=&id=uO9FbEcaMpkC&oi=fnd&pg=PR3&dq=historIA+BIG+ DATA&ots=V-CZ_joNA_&sig=y3tN6kciFz8OKeAzwQ8L6mJxNsY#v=onepage&q=historIA% 20BIG%20DATA&f=false.
dc.relation.references[5] J. Puyol Moreno, «Una aproximación a Big Data,» UNED. Revista de Derecho de la UNED(RDUNED), núm 14, 473 cita 5, 2014, Disponible en: https : / / www . researchgate. net/ publication/ 345344852_ Una_ aproximacion_ a_ Big_ Data .
dc.relation.references[6] J. Harris, ¿Qué es un Data Lake y por qué es importante? Disponible en: https : // www. sas. com/ es_ co/ insights/ articles/ data-management/ what-is-a-datalake- and-why-does-it-matter-.html , s.f. visitado 3 de sep. de 2025.
dc.relation.references[7] P. Strengholt, Building Medallion Architectures, Designing with Delta Lake and Spark. O’Reilly Media, 2025, págs. 4, 5, 33, 34-396, isbn: 978-1-098-17883-3. dirección: https: / / www . oreilly . com / library / view / building - medallion - architectures / 9781098178826/.
dc.relation.references[8] Actian, Data, Explored #1: The Big Medallion Architecture Debate, Disponible en: https: // www. youtube. com/ watch? v= HKtNmglitiI , 2025. visitado 3 de sep. de 2025.
dc.relation.references[9] M. Plazotta y M. Klettke, «Data Architectures in Cloud Environments,» Datenbank Spektrum 24 , Springer Nature Link, págs. 243-247, 2024, Disponible en: https: // link. springer. com/ article/ 10. 1007/ s13222-024-00490-5 .
dc.relation.references[10] R. J. Schiller y D. Larochelle, Data Engineering Best Practices Architect Robust and Cost-effective Data Solutions in the Cloud Era. Packt Publishing, 2024, preview disponible de las 550, isbn: 9781803247366, 1803247363. dirección: https://www.google. com.co/books/edition/Data_Engineering_Best_Practices/vr4gEQAAQBAJ?hl=en& gbpv=0.
dc.relation.references[11] W. Liljedahl, «Designing and Implementing a Data Architecture for a Medium-Sized Business,» Novia University of Applied Sciences, Vaasa, inf. téc., 2025, Degree Thesis for a Master of Engineering (UAS) - Degree Programme: Industrial Management and Engineering Disponible en: https: // www. theseus. fi/ bitstream/ handle/ 10024/ 894222/ Liljedahl_ William. pdf? sequence= 2 .
dc.relation.references[12] S. INNOVATIONS, Migration Service, Disponible en: https : / / staginvs . com / services-post/ migration-service/ , s.f. visitado 12 de nov. de 2025.
dc.relation.references[13] U. C. A. Bello, COMPARACIÓN ENTRE BIG DATA Y OTRAS ÁREAS. LA ARQUITECTURA, EL CICLO DEL DATO. ÁREAS DE APLICACIÓN, RETOS ACTUALES Y CASOS DE ÉXITO, Disponible en: https: // api-saber. ucab. edu. ve/ server/ api/ core/ bitstreams/ 3d652888- 3201- 4cbb- aea4- f406cea269f5/ content , s.f. visitado 12 de nov. de 2025.
dc.relation.references[14] Databricks, Medallion Architecture, Disponible en: https: // www. databricks. com/ glossary/ medallion-architecture , s.f. visitado 12 de nov. de 2025.
dc.relation.references[15] N. Marz y J. Warren, Big Data: Principles and best practices of scalable realtime data systems, 1st. USA: Manning Publications Co., 2015, Disponible en: https: // dl. acm. org/ doi/ 10. 5555/ 2717065 , isbn: 1617290343.
dc.relation.references[16] J. Llanos F., «IMPLEMENTACIÓN DE UN SISTEMA DE ALMACENAMIENTO DE DATOS MASIVOS PARA MONITOREO ESTRUCTURAL,» Universidad de Concepción, Chile, inf. téc., 2018, Departamento de Ingeniería Informática. Disponible en: https: // repositorio. udec. cl/ server/ api/ core/ bitstreams/ 97b608c6-44e8- 4f47-bc32-cd89ee7f8a3e/ content .
dc.relation.references[17] M. Feick, N. Kleer y M. Kohn1, «Fundamentals of Real-Time Data Processing Architectures Lambda and Kappa,» Lecture Notes in Informatics (LNI), Gesellschaft für Informatik, Bonn, inf. téc., 2018, Disponible en: https: // dl. gi. de/ server/ api/ core/ bitstreams/ fe42f563-d4dd-48fa-b70c-4540442f4940/ content .
dc.relation.references[18] J. N. Mazón López, J. Pardillo Vela y J. C. Trujillo Mondejar, DISEÑO Y EXPLOTACIÓN DE ALMACENES DE DATOS - Conceptos Básicos de Modelado Dimensional. Editorial Club Universitario, 2011, págs. 3, 14, isbn: 978-84-9948-546-1 e- book y 978-84-8454-902-4. dirección: https://books.google.com.co/books?hl=es&lr= &id=KcXnCgAAQBAJ&oi=fnd&pg=PR5&dq=conceptos+generales+de+arquitectura+ del + almacen + de + datos & ots = lisRxXIpuX & sig = do0Hu1IpZEA1Jnf _ 8vrft57yAJQ & redir_esc=y#v=onepage&q=conceptos%
dc.relation.references[19] J. M. Aristizábal Díaz, «Metodología para la Implementación de un Data Lakehouse,» UNIVERSIDAD EAFIT, Medellín, Colombia, inf. téc., 2024, Proyecto de grado Presentado como Requisito Parcial Para Obtener el Título de Magíster en Ingeniería - Disponible en: https: // repository. eafit. edu. co/ server/ api/ core/ bitstreams/ b13b6317-f03e-4fc9-b263-bb0a770833c9/ content .
dc.relation.references[20] Databricks, What is the medallion lakehouse architecture? Disponible en: https: // docs. databricks. com/ aws/ en/ lakehouse/ medallion , 2025. visitado 20 de nov. de 2025.
dc.relation.references[21] R. Software, 12 Data Engineering Best Practices for Building a Robust Data Infrastructure, Disponible en: https: // www. rishabhsoft. com/ blog/ data- engineeringbest- practices , 2024. visitado 20 de nov. de 2025.
dc.relation.references[22] M. Powers, Delta Lake Schema Evolution, Disponible en: https: // delta. io/ blog/ 2023-02-08-delta-lake-schema-evolution/ , 2023. visitado 23 de nov. de 2025.
dc.relation.references[23] D. Lake, Welcome to the Delta Lake documentation, Disponible en: https: // deltadocs- incubator. netlify. app/ , s.f. visitado 23 de nov. de 2025.
dc.relation.references[24] Microsoft, Understand medallion lakehouse architecture for Microsoft Fabric with One- Lake, Disponible en: https: // learn. microsoft. com/ en- us/ fabric/ onelake/ onelake-medallion-lakehouse-architecture , s.f. visitado 23 de nov. de 2025.
dc.relation.references[25] B. Vaillants, Medallion Architecture, Explained: How Bronze–Silver–Gold Layers Supercharge Your Data Lakehouse, Mesh, and Data Quality, Disponible en: https: // bixtech. com/ medallion-architecture-explained-how-bronzesilvergold-layerssupercharge- your-data-lakehouse-mesh-and-data-quality/ , 2025. visitado 23 de nov. de 2025.
dc.relation.references[26] S. Sagi, Understanding Medallion Architecture: Layers of a Lakehouse, Disponible en: https : / / medium . com / itversity / understanding - medallion - architecture - layers-of-a-lakehouse-804ad60a55fc , 2025. visitado 23 de nov. de 2025.
dc.relation.references[27] S. Salami, Hub Star Modeling 2.0 for Medallion Architecture, 2025. arXiv: 2504.08788 [cs.DB]. dirección: https://arxiv.org/abs/2504.08788.
dc.subjectArquitectura Medallón
dc.subjectData Engineering
dc.subjectData Platform
dc.subjectData Lakehouse
dc.subjectComputer Science
dc.subjectBig Data
dc.subject.keywordMedallion Architecture
dc.subject.keywordData Engineering
dc.subject.keywordData Platform
dc.subject.keywordData Lakehouse
dc.subject.keywordComputer Science
dc.subject.keywordBig Data
dc.subject.lembAlmacenamiento de datos
dc.subject.lembArquitectura de datos
dc.subject.lembMacrodatos
dc.titleArquitectura Medallón: análisis integral y aplicaciones
dc.type.coarhttp://purl.org/coar/resource_type/c_18ws

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
TRABAJO_FINAL_TADEO_ArqM_2025_II (004) (1).pdf
Tamaño:
4.19 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis

Bloque de licencias

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.28 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
Cargando...
Miniatura
Nombre:
FOR-EFE-GDB-007_AUTORIZACION_DE_PUBLICACION_DE_TESIS_O_TRABAJO_DE_GRADO firmado.pdf
Tamaño:
258.82 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta de autorización