García Bedoya, Olmer
Granados Erazo, Oscar Mauricio
Colombia
González Martínez, Edwin Fernando
2021-04-13T00:38:07Z
2021-04-13T00:38:07Z
2021
http://hdl.handle.net/20.500.12010/18671
Las redes neuronales adversarias generativas adversarias (GANs), es un algoritmo de arquitectura de alto nivel que son parte del conjunto de la inteligencia artificial y del aprendizaje automático. Las GANs son dos redes neuronales llamadas generador y discriminador, y estas dos redes neuronales compitan entre si creando así una optimización de los resultados de alta calidad. Las GANs fueron propuestas por Goodfellow en el año 2014 que buscaba otro tipo de enfoque de modelado generativo basado en redes generadoras diferenciables, su amplia aplicación en la tecnología no tiene límites. Su objetivo de aplicación aborda desde imágenes, textos, vídeos, sonidos entre otros. Además, existen una gran variedad de arquitecturas GANs donde busca la optimización dado a su tarea de aprendizaje y desarrollo de aplicación. El objetivo de trabajo de grado constituye en crear una red neuronal de alto nivel como las GANs para la creación de información sintética por medio de ayuda del aprendizaje supervisado. Además, se evalúa con métodos estadísticos multivariantes contrastar hipotéticamente por igualdad de promedios y homogeneidad de varianzas entre la información real y la sintética. Estos métodos científicos estadísticos multivariados permiten que la información sintética generada por las GANs sea de alta calidad y permitan recrear cierta cantidad de información para realizar análisis a gran escala. Además, la información real corresponde a un corresponsal no bancario de una ciudad en Colombia, por cuestiones de confidencialidad no se puede divulgar el nombre de la entidad bancaria y sus clientes. Se cuenta con información transaccional con 67244 registros y 7 variables. Con base a la información real del corresponsal no bancario se genera nueva información sintética por medio de las GANs, y contrastadas estadísticamente sus igualdades en promedios y varianzas. Dado a la información sintética para la identificar posibles casos de lavado de activos donde se quiere identificar patrones y características inusuales para mitigar el lavado de activos. Sin embargo, esto constituye que la información que se genere no puede ser publicada dado a que la información que se está analizando es sintética, por lo tanto, no se puede realizar análisis descriptivos o inferenciales estadísticos de la población.
56 páginas
application/pdf
spa
Universidad de Bogotá Jorge Tadeo Lozano
instname:Universidad de Bogotá Jorge Tadeo Lozano
reponame:Expeditio Repositorio Institucional UJTL
Datos sintéticos
Transacciones
Lavado de activos
Generador de datos sintéticos para el monitoreo de transacciones con factores de riesgo de lavado de activos
Trabajo de grado de maestría
Redes neurales (Informática)
Instituciones financieras
Lavado de activos
Transacciones
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/acceptedVersion
Abierto (Texto Completo)
http://expeditio.utadeo.edu.co
Magíster en Ingeniería y Analítica de Datos
Maestría en Ingeniería y Analítica de Datos
Behjati Razieh, Arisholm Erik, Bedregal Margrethe & Tan Chao (2019) Synthetic Test Data Generation Using Recurrent Neural Networks: A Position Paper, IEEE/ACM 7th International Workshop on Realizing Artificial Intelligence Synergies in Software Engineering (RAISE), ISBN 978-1-7281-2272-4, DOI:10.1109/RAISE.2019.00012
Burgos Miaría (2010) Cómo interpretar un artículo sobre pruebas diagnósticas Revista chilena de cirugía, volumen 62, número 3, DOI 10.4067/S0718-40262010000300018.
Brett K. Beaulieu-Jones, Zhiwei Steven Wu, Chris Williams, Ran Lee, Sanjeev P. Bhavnani, James Brian Byrd & Casey S. Greene (2019) Privacy-Preserving Generative Deep Neural Networks Support Clinical Data Sharing. Revista Circulation: Cardiovascular Quality and Outcomes, , Volumen 12, Nu´mero 7. DOI: 10.1161/CIRCOUTCOMES.118.005122, ISSN 2051-1329
Chollet Francois (2018) Deep Learning with Python Primera Edición 2018 Nueva York, United States of America, ISBN 9781617294433 Ed. Manning Publications Co.
Dionysios S. Demetis (2018) Money laundering, Systems theory, Transaction monitoring systems, Profiling. Revista Decision Support Systems, Volumen 105. DOI: https://doi.org/10.1016/j.dss.2017.11.005
Díaz Monroy Luis Guillermo & Morales Rivera Mario Alfonso. (2012) Análisis Estadístico de Datos Multivariados. Primera Edición 2012 Bogotá, Colombia, ISBN 978-958-761-325-4 Ed. Universidad Nacional de Colombia
García Olmer, Granados Oscar & Burgos José (2020) AI against Money Laundering Networks: the Colombian case. Revista Journal of Money Laundering Control, DOI: 10.1108/JMLC-04-2020-0033, ISSN 1368-5201
Gracia Granados Marlon Efraín (2019) Máquinas de Soporte Vectorial y Arboles de Clasificación para la Detección de Operaciones Sospechosas de Lavado de Activos. Revista Lámpsakos, Volumen 01, Número 21. DOI: https://doi.org/10.21501/21454086.2904
González Martínez Edwin Fernando (2018) Detección de Fraude en Tarjetas de Crédito Mediante Técnicas de Minería de Datos. Tesis de Grado, Universidad Santo Tomás, Bogotá Colombia
Goodfellow Ian, Bengio Yoshua & Courville Aaron (2017) Deep Learning Primera Edición 2017 Massachusetts, United States Of America ISBN 9780262035613 Ed. MIT Press
Goodfellow Ian., Pouget-Abadie J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A.C., & Bengio, Y. (2014) Generative Adversarial Networks Cornell University
Guevara Jorge, García Olmer & Granados Oscar (2020) Machine Learning Methodologies against Money Laundering in Non-Banking Correspondents, Universidad Jorge Tadeo Lozano, Bogotá Colombia
Guerino Ardizzi, Pierpaolo De Franceschis & Michele Giammatteo (2018) Cash payment anomalies and money laundering: An econometric analysis of Italian municipalities.Revista International Review of Law and Economics, Volumen 56. DOI: doi.org/10.1016/j.irle.2018.08.001. ISSN 0144-8188
Haroldo Ribeiro, Alves Luiz, Martins Alvaro, Lenzi Ervin & Perc Matjaz (2018) The dynamical structure of political corruption networks. Revista Journal of Complex Networks, Volumen 6, Número 6, DOI: https://doi.org/10.1093/comnet/cny002, ISSN 2051-1329
James Jordon, Jinsung Yoon & Mihaela van der Schaar (2019) PATE-GAN: Generating Synthetic Data with Differential Privacy Guarantees. Revista OpenReview.net
Jerome P. Reiter (2004) Simultaneous Use of Multiple Imputation for Missing Data and Disclosure Limitation
Killian J. McCarthy, Peter van Santen & Ingo Fiedler (2015) Modeling the money launderer: Microtheoretical arguments on anti-money laundering policy. Revista International Review of Law and Economics, Volumen 43. DOI: doi.org/10.1016/j.irle.2014.04.006
Langr Jakub & Bok Vladimir (2019) GANs in Action Deep learning with Generative Adversarial Networks Primera Edicio´n 2019 New York, United States of America. ISBN 9781617295560 Ed. Manning Publications Co
Le-Khac Nhien-An, Markos Sammer & Kechadi Tahar (2016)A data mining-based solution for detecting suspicious money laundering cases in an investment bank Cornell University
Luna-Pla Issa and Nicola´s-Carlock, Jos´e R. (2020) Corruption and complexity: a scientific framework for the analysis of corruption networks. Revista Applied Network Science, Volumen 5, Nu´mero 1, DOI: 10.1007/s41109-020-00258-2, ISSN 2364-8228
Maryam Imanpour, Stephanie Rosenkranz, Bastian Westbrock, Brigitte Unger & Joras Ferwerda (2019) A microeconomic foundation for optimal money laundering policies. Revista International Review of Law and Economics, Volumen 60. DOI: doi.org/10.1016/j.irle.2019.105856, ISSN 0144-8188
McCulloch, Warren, Walter Pitts (1943) A Logical Calculus of Ideas Immanent in Nervous Activity Bulletin of Mathematical Biophysics 5 115-133, Revista Springer, Volumen 52, Nu´mero 1-2. DOI: https://doi.org/10.1007/BF02478259.
Norman Loayza and Edgar Villa & Martha Misas (2019) Illicit activity and money laundering from an economic growth perspective: A model and an application to Colombia. Revista Journal of Economic Behavior & Organization, Volumen 159. DOI: doi.org/10.1016/j.jebo.2017.10.002
Surendra. H & Mohan. H.S. (2017) A Review Of Synthetic Data Generation Methods For Privacy Preserving Data Publishing International Journal Of Scientific & Technology Research Volume 6, ISSUE 03, March 2017, ISSN 2277-8616
Sun Yi, Cuesta Infante, Veeramachaneni Kalyan (2018) Learning Vine Copula Models For Synthetic Data Generation, Cornell University
T.E. Raghunathan, J.P. Reiter & D.B. Rubin (2003) Multiple Imputation Statistical Disclosure Limitation Journal Of Official Stadistics, Volume 19 No. 1
Rafa . Drezewski, Jan Sepielak & Wojciech Filipkowski (2015) The application of social network analysis algorithms in a system supporting money laundering detection.Revista Information Science, Volumen 295. DOI: https://doi.org/10.1016/j.ins.2014.10.015
Sandfort Veit, Yan Ke, Pickhardt Perry & Summers Ronald (2019) Data augmentation using generative adversarial networks (CycleGAN) to improve generalizability in CT segmentation tasks. Revista Scientific Reports, Volumen 9, Nu´mero 1. DOI: 10.1038/s41598019-52737-x
Schneider Friedrich & Windischbauer Ursula (2008) Money Laundering: Some Facts. Revista European Journal of Law and Economics, Volumen 26, DOI: doi.org/10.1007/s10657-008-9070-x
Schneider Friedrich (2010) Turnover of organized crime and money laundering: some preliminary empirical findings.Revista Springer, Volumen 144, Nu´mero 3/4, ISSN 00485829, 15737101
Tan Chao, Behjati Razieh & Arisholm Erik (2019) A Model-Based Approach to Generate Dynamic Synthetic Test Data: A Conceptual Model, IEEE International Conference on Software Testing, ISBN 978-1-7281-0888-9, DOI:10.1109/ICSTW.2019.00026
Tanzi Vito & Davoodi Hamid (1997) Corruption, Public Investment, and Growth. Revista IMF Working Papers, Volumen 97, DOI: https://doi.org/10.5089/9781451929515.001
Walker John (1999) How Big is Global Money Laundering?. Revista Journal of Money Laundering Control, Volumen 3, Nu´mero 1. DOI: 10.1108/eb027208, ISSN 1368-5201
Walker John & Unger Brigitte (2009) Measuring Global Money Laundering: The Walker Gravity Model.Revista Review of Law and Economics, Volumen 5, DOI: doi.org/10.2202/1555-5879.1418
Weber Mark, Domeniconi Giacomo, Chen Jie, Daniel Karl I. Weidele , Bellei Claudio, Robinson Tom & Leiserson Charles E. (2019)Anti-Money Laundering in Bitcoin: Experimenting with Graph Convolutional Networks for Financial Forensics Cornell University
Xi Chen, Yan Duan, Rein Houthooft, John Schulman, Ilya Sutskever & Pieter Abbeel (2016) InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets Cornell University
Yanchang Zhao, Yonghua Cen, & Justin Cen (2013) Data Mining Applications with R. Elsevier Science, ISBN libro electr´onico 9780124115200
Yan Zhu, Taesung Park, Phillip Isola & Alexei Efros (2017) Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. Cornell University
Yun Yang, Fengtao Nan, Po Yang, Qiang Meng, Yingfu Xie, Dehai Zhang & Khan Muhammad (2019) GAN-Based Semi-Supervised Learning Approach for Clinical Decision Support in Health-IoT Platform, IEEE Access , DOI:10.1109/ACCESS.2018.2888816
#GeneradorDeDatosSintéticosMonitoreoTransaccionesFactoresRiesgoLavadoDeActivos
#GeneradorDeDatosSintéticosFactoresRiesgoLavadoDeActivos
#GeneradorDeDatosSintéticosMonitoreoTransaccionesLavadoDeActivos
Adversary generative adversary neural networks (GANs), is a high-level architectural algorithm that is part of the set of artificial intelligence and machine learning. The GANs are two neural networks called generator and discriminator, and these two neural networks compete with each other, thus creating a high-quality optimization of the results. GANs were proposed by Goodfellow in 2014, which was looking for another type of generative modeling approach based on differentiable generator networks, its wide application in technology has no limits. Its application objective deals with images, texts, videos, sounds, among others. In addition, there are a wide variety of GANs architectures where you seek optimization given your learning and application development task. The objective of the degree work is to create a high-level neural network such as GANs for the creation of synthetic information through the help of supervised learning. In addition, it is evaluated with multivariate statistical methods to contrast hypothetically for equality of averages and homogeneity of variances between real and synthetic information. These multivariate statistical scientific methods allow the synthetic information generated by the GANs to be of high quality and allow to recreate a certain amount of information for large-scale analysis. In addition, the real information corresponds to a non-bank correspondent from a city in Colombia, for confidentiality reasons the name of the bank and its clients cannot be disclosed. There is transactional information with 67244 records and 7 variables. Based on the real information of the non-bank correspondent, new synthetic information is generated through the GANs, and their equalities in averages and variances are statistically contrasted. Given the synthetic information to identify possible cases of money laundering where you want to identify unusual patterns and characteristics to mitigate money laundering. However, this constitutes that the information generated cannot be published since the information being analyzed is synthetic, therefore, descriptive or inferential statistical analyzes of the population cannot be carried out.
info:eu-repo/semantics/masterThesis
http://purl.org/coar/resource_type/c_bdcc