ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Características de los DWH


Enviado por   •  24 de Marzo de 2019  •  Apuntes  •  890 Palabras (4 Páginas)  •  51 Visitas

Página 1 de 4
  1. Conceptos Generales
  • Describe al menos seis características de los DWH.
  • La información se clasifica de acuerdo a los intereses particulares de cada institución.
  • Es un repositorio de información integrado, es decir, contiene los datos de todos los sistemas operacionales de la institución de manera consistente.
  • La información almacenada es histórica, lo que significa que puede ser solicitada para cualquier periodo requerido, siempre y cuando, exista dentro del repositorio.
  • Sólo se almacenan los datos más relevantes, organizados por temas para facilitar su acceso y entendimiento por parte de los usuarios finales.
  • La información no se modifica ni se elimina, lo cual está ligado con el punto anterior. Una vez almacenado un dato, se convierte en información de sólo lectura, para poder consultarlo en futuras ocasiones. Base de datos tipo OLAP (On Line Analytical Processing).
  • Puede ser alimentado de diferentes fuentes e incluso proveedores de bases de datos.
  • Contiene metadatos  que permiten simplificar y automatizar la obtención de la información al realizar una consulta dentro del DWH.
  • Indica qué es una tabla de hechos, qué es una tabla de dimensión y que son las jerarquías.
  • Tabla de Hechos: es la tabla central de un modelo estrella comúnmente utilizados en los DWH. Los hechos son los indicadores del negocio, es decir, todas las medidas numéricas que se incluyen en el DWH. Dentro de sus características más importantes están el nivel de detalle de la información que se almacena, por lo que antes de crear la tabla de hechos debe conocerse a la perfección la información que se guardará; debe localizarse el origen de la información que se quiere cargar, entender el significado de los indicadores y determinar el nivel de detalle de estos datos. Los hechos contienen medias u observaciones y se relacionan con tablas de dimensión a través de llaves foráneas.
  • Tabla de Dimensión: relacionadas a la tabla de hechos a través de una llave primaria, son los datos que nos permiten filtrar, agrupar o seccionar la información. En esta tabla se encuentran los descriptores que nos sirven para interpretar la información.
  • Jerarquías: las dimensiones se agrupan en jerarquías mediante relaciones uno-a-muchos. Por ejemplo: una población agrupa a muchos clientes, una provincia agrupa a muchas poblaciones. Es decir, son los mapas de navegación. Se representan de manera muy sencilla cuando se tiene modelos multidimensionales.

Las jerarquías permiten dos tipos de exploraciones:

  • Ascendentes (roll-up): permite desplazar la jerarquía hacia arriba, agrupándola en unidades mayores a través de una dimensión.
  • Descendentes (drill-down): ofrece la función “de grano más fino”, es decir por ejemplo, continente 🡪 país 🡪 regiones 🡪 estados 🡪 provincias…

  • Describe los conceptos:
  • Esquema Estrella: son modelos de relaciones, los cuales cuentan con una tabla de hechos principal rodeada por dimensiones, se pueden tener una infinidad de tablas las cuales estarán relacionadas con una llave principal.

[pic 2]

  • Copo de Nieve: son modelos de relaciones como el esquema de estrella, con la particularidad de que se desprenden más dimensiones de una dimensión relacionada a la tabla de hechos,  las tablas de en esquema de copo de nieve tienen una dimensión normalizada, es decir, quito información redundante para sólo quedarme con lo que realmente me servirá.

[pic 3]

  • Constelación de Hechos: son modelos que combinan tanto el esquema de estrella como el de copo de nieve, pero este modelo se contemplan las tablas de copo de nieve que están des normalizadas. Los esquemas de constelación están normalizados para eliminar las redundancias de las dimensiones. Para normalizar el esquema, las jerarquías dimensionales compartidas se colocan en outriggers.

[pic 4][pic 5]

  • Investiga cuál es el objetivo y las características de los procedimientos de SAS:
  • POC FREQ: El procedimiento genera tablas de frecuencia, usualmente utilizadas para comprobar la calidad de los datos y evaluar si existen valores extraños para poder realizar correcciones. 
  • PROC MEANS: Realiza estadísticos básicos para la toma de decisiones.
  • Indica algunas ventajas y desventajas (que consideres) de la programación con BASE y el procedimiento PROC SQL, desde el punto de vista de la manipulación de datos.
  1. SAS

Tomando como base el dataset HEART que se te proporciona y que mantiene información de alrededor de 5209 observaciones correspondientes a un estudio de enfermedades del corazón. Apoyándote en lo revisado en clase, crea un par de reportes y/o gráficas (los datos a mostrar son a tu consideración) utilizando:

  • PROC PRINT
  • PROC TABULATE
  • PROC REPORT
  • PROC GCHART

  1. Creación de un cubo y un reporte el Inventario Foodmart

Apoyándote en Analysis Services de SQL Server crea el cubo correspondiente al esquema de DWH para el inventario que se muestra al final de esta especificación. El cubo deberá incorporar todos los hechos almacenados en la tabla inventory_fact_1998.

...

Descargar como (para miembros actualizados)  txt (5.6 Kb)   pdf (347.4 Kb)   docx (523.7 Kb)  
Leer 3 páginas más »
Disponible sólo en Clubensayos.com