ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Proceso de Extracción, Transformación y Carga


Enviado por   •  31 de Octubre de 2017  •  Síntesis  •  608 Palabras (3 Páginas)  •  116 Visitas

Página 1 de 3

Proceso de Extracción, Transformación y Carga

Para la realización de nuestro cubo multidimensional se ha utilizado la base de datos de prueba de una empresa hipotética llamada Adventure Works y que está compuesta por 5 áreas principales: Recursos Humanos, Ventas, Compras, Procesos y Clientes pero nos hemos enfocado en la realización de un cubo para el área de ventas que es una de las más demandas en todas las empresas.

El área de clientes está compuesta por 19 tablas que son las que se pueden observar en la siguiente captura de pantalla:

[pic 1]

Ahora bien, una vez que hemos identificado las tablas y sus respectivos campos debemos de enfocarnos en aquellos que con cierta transformación y asociada a alguna dimensión puedan representar información importante para la empresa.

Por ejemplo, podemos observar que existe una tabla donde se almacena la información concerniente a las órdenes de ventas de los productos y que es SalesOrderHeader y dentro de ella podemos observar algunos atributos como lo son: SubTotal, TaxAmt, TotalDue, Status por mencionar algunos de sus campos principales y de los cuales podemos obtener información como la venta total de un conjunto de productos y la cual la podemos relacionar con la tabla SalesOrderDetail en la cual podemos encontrar campos como la cantidad de productos en una venta, el ID del producto y su precio unitario por lo que podemos extraer esa información de esas tablas y las podemos y cargarlas en una nueva tabla que será parte de nuestro DataMarts de Ventas para la empresa, la creación de este DataMarts será de vital importancia para poder realizar como paso siguiente la obtención de un cubo multidimensional.

Entre los primeros pasos que se deben realizar para iniciar con el proceso ETL es definir la estructura del DataMarts, en nuestro caso decidimos construir una estructura de Copo de Nieve debido a que la entidad de productos se puede mantener normalizada con respecto a las subcategorías en las que se dividen y esto es así para poder mantener un mejor control de la nueva base de datos. La estructura de esta nueva Base de Datos que será nuestro DataMarts se muestra en el siguiente diagrama:

[pic 2]

Una vez que ya tenemos creada nuestra nueva base de datos ya podemos empezar con los pasos específicos de ETL, en nuestro caso hemos utilizado la herramienta SQL Server Integration Services.

  1. Dentro de SQL Server Integration Services procedemos a crear un nuevo Data Flow que este se podría definir como un flujo de datos en donde especificaremos de dónde obtendremos los datos de origen y hacia qué destino los enviaremos, también es dentro de este flujo que podremos extraer los campos de una tabla y enviarlos a la tabla final del DataMarts a crear.

[pic 3]

  1. Luego, dentro de este flujo de datos definiremos el origen de los datos que en nuestro caso es de la base de datos llamada AdventureWorks y elegimos una de las tablas que ocuparemos, una de ellas es la tabla Sales.SalesOrderDetail de la cual solo necesitaremos algunos campos como podemos observar en las siguientes capturas de pantalla.

[pic 4]

[pic 5]

  1. Ahora, procedemos a definir el destino, que en nuestro caso es el DataMarts AdventureWorks y en el destino vamos a poder observar la opción donde relacionaremos cuáles campos serán dirigidos a sus destinos como se puede observar en las siguientes capturas de pantalla:

[pic 6]

[pic 7]

Podemos observar que no todos los campos del origen tienen asociado un campo de destino y es que esto se debe a que en la tabla de destino necesitamos datos de otros orígenes por lo que este mismo procedimiento debe de ejecutarse para todas las tablas donde existen dependencias.

...

Descargar como (para miembros actualizados)  txt (3.6 Kb)   pdf (499.7 Kb)   docx (667.3 Kb)  
Leer 2 páginas más »
Disponible sólo en Clubensayos.com