Escudo de la República de Colombia
Sistema Nacional de Biliotecas - Repositorio Institucional Universidad Nacional de Colombia Biblioteca Digital - Repositorio Institucional UN Sistema Nacional de Bibliotecas UN

Comparación de herramientas ETL de código abierto

Ruíz Borja, Jhoan Esteban (2019) Comparación de herramientas ETL de código abierto. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.

Texto completo

[img] PDF - Versión Aceptada
Available under License Creative Commons Attribution Non-commercial No Derivatives.

4MB

Resumen

El objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ETL, y de facilitar no solo a los usuarios, sino también a empresas, que deseen aplicar algún proceso ya sea de extracción, transformación o carga de datos, mejorando el enfoque de inteligencia del negocio con estas herramientas adecuadas para el tratamiento de datos. Se propuso describir varias herramientas de la actualidad, donde luego se describen los motivos de selección de las tres herramientas, prosiguiendo a la descripción detallada de las elegidas, para saber que capacidades poseen a la hora de realizar el proceso ETL, adicionalmente se dan los criterios de comparación, donde luego se presenta un ejemplo práctico, que permite comparar, para luego sugerir en qué casos puede ser más útil una herramienta con respecto a otra según sus características. Por último, se presentan cuadros comparativos, donde se podrá resaltar las ventajas y desventajas de cada herramienta, junto con unas sugerencias que plantea qué herramienta utilizar para un caso dado, según la necesidad del usuario o empresa., Abstract: The main objective of the present final work is the comparison of Pentaho Data Integration, Talend Data Integration and OpenRefine, three open source tools of ETL (Extraction, Transformation and Load), with the purpose of promoting the importance that the ETL process currently has, and to facilitate not only to the users, but also the companies, who wish to apply some process, involving Extraction, Transformation or Loading of data, to improve the Business Intelligence approach with these appropriate tools for data processing. It was proposed to describe several current tools, then we describe the reasons for selecting the tools to be compared, continuing with the detailed description of the three tools chosen, to explore what capabilities they possess when carrying out the ETL process, additionally the comparison criteria are given, and then a practical example is presented, which allows comparing, and then suggesting in which cases a tool can be more useful with respect to another according to its characteristics. Finally, comparative tables are presented, where the advantages and disadvantages of each tool can be highlighted, along with a brief guide that suggests which tool should be used for a specific case, according to the user's or company's need

Tipo de documento:Tesis/trabajos de grado - Thesis (Maestría)
Colaborador / Asesor:Jiménez Ramírez, Claudia and Velázquez Henao, Juan David
Información adicional:Magister en Ingeniería de Sistemas
Palabras clave:Pentaho Data Integration (PDI), Talend Data Integration (TDI), OpenRefine (OR), Código abierto
Temática:0 Generalidades / Computer science, information & general works
Unidad administrativa:Sede Medellín > Facultad de Minas > Escuela de Sistemas
Código ID:71803
Enviado por : Maestro Jhoan Esteban Ruiz Borja
Enviado el día :10 Apr 2019 21:48
Ultima modificación:10 Apr 2019 21:48
Ultima modificación:10 Apr 2019 21:48
Exportar:Clic aquí
Estadísticas:Clic aquí
Compartir:

Solamente administradores del repositorio: página de control del ítem

Vicerrectoría de Investigación: Número uno en investigación
Indexado por:
Indexado por Scholar Google WorldCat DRIVER Metabiblioteca OAIster BASE BDCOL Registry of Open Access Repositories SNAAC Red de repositorios latinoamericanos eprints Open archives La referencia Tesis latinoamericanas OpenDOAR CLACSO
Este sitio web se ve mejor en Firefox