ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Data WareHouse


Enviado por   •  1 de Julio de 2023  •  Trabajos  •  2.325 Palabras (10 Páginas)  •  26 Visitas

Página 1 de 10

[pic 1][pic 2][pic 3][pic 4][pic 5]

[pic 6]

[pic 7]

[pic 8]

[pic 9]

[pic 10]

[pic 11][pic 12][pic 13]

[pic 14]

[pic 15]

ÍNDICE

Introducción:        1

Definición de datawarehouse:        2

Los objetivos fundamentales de un Data WareHouse        2

Los elementos básicos de un Data WareHouse        3

Los procesos básicos del Data WareHouse (ETL)        3

Características        3

Arquitectura datawarehouse        5

Planificación de infraestructura de datawarehouse        5

Ejemplos de un data warehouse        6

Tipos de data warehouse        6

Ventajas y desventajas        6

Conclusión:        7

Bibliografía:        7

Introducción:

Anteriormente, los almacenes de datos se construyeron utilizando datos repetitivos y estructurados que fueron filtrados antes de ingresar al almacén de datos. No obstante, en los últimos años, el concepto de data warehouse ha evolucionado gracias a la capacidad de incorporar información contextual a los datos no estructurados y almacenados también. Esta evolución ha permitido ampliar la variedad de datos que pueden ser utilizados en el entorno de la data warehouse.

Un data warehouse es un repositorio centralizado de datos provenientes de diferentes sistemas de una empresa, que puede ser físico o lógico y se enfoca en la captura de datos de diversas fuentes con el propósito de análisis y acceso. Por lo general, se aloja en un servidor corporativo o en la nube. Los datos de aplicaciones de procesamiento de transacciones en línea (OLTP) y otras fuentes se extraen selectivamente para ser utilizados por aplicaciones analíticas y consultas de usuarios. El data warehouse es una arquitectura de almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar los datos para la toma de decisiones estratégicas.

El concepto de data warehouse ha surgido como una solución integral y popular para las necesidades de acceso rápido y sencillo a información estructurada y de calidad que sea relevante para la toma de decisiones empresariales. Cada constructor de data warehouse considera su sistema como un componente fundamental en la estrategia y arquitectura de tecnología de la información de su empresa.

El objetivo principal de un data warehouse es proporcionar un acceso instantáneo a la información relevante para la toma de decisiones de gestión empresarial. En resumen, se puede describir informalmente como una copia estructurada de datos de transacciones, diseñada específicamente para consultas y generación de informes. También se puede decir que un data warehouse es el procesamiento y análisis de datos estructurados fuera del sistema operativo principal de la empresa.

Definición de datawarehouse:

Un data warehouse es un almacenamiento unificado de todos los datos recopilados por varios sistemas de la empresa. El almacenamiento puede ser físico o lógico, centrándose en la recopilación de datos de diversas fuentes, principalmente con fines de análisis y acceso. Los almacenes de datos suelen estar alojados en los servidores de la empresa o, cada vez más, en la nube. Extraiga datos de forma selectiva de una variedad de aplicaciones de procesamiento de transacciones en línea (OLTP) y otras fuentes para usar en consultas de usuarios y aplicaciones analíticas. Un data warehouse es una arquitectura de almacén de datos que permite a los líderes empresariales organizar, comprender y utilizar sus datos para tomar decisiones estratégicas. Un data warehouse es una arquitectura familiar para muchas empresas en la actualidad.

Su estructura de un data warehouse puede ser dividida en 3 estructuras simplificadas: básica, básica con un área de ensayo, básica con área de ensayo y data marts.

  • Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos. Los usuarios finales pueden acceder a ellos para su análisis, generación de informes y minería.
  • Al añadir un área de ensayo, que se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén. Es posible personalizar la arquitectura del almacén para diferentes grupos dentro de la organización.
  • Se puede hacer agregando data marts, que son sistemas diseñados para una línea de negocio en particular. Se pueden tener data marts separados para ventas, inventario y compras, por ejemplo, y los usuarios finales pueden acceder a datos de uno o de todos los data marts del departamento.

Los objetivos fundamentales de un Data WareHouse

  • Esto hace que la información de la organización sea fácilmente accesible: los contenidos de los almacenes de datos son fáciles de entender y navegar, y el acceso a ellos se caracteriza por la rapidez. No hay restricciones ni límites establecidos en estos requisitos. Cuando hablamos de una comprensión fácil, significa que el nivel de información es correcto y obvio. El canal significa identificar el destino en la pantalla y simplemente hacer clic en el clic para alcanzar la posición deseada. Rendimiento rápido significa latencia cero. Todo lo demás es un compromiso, así que queremos mejorar.
  • Conciliación de la información de la organización: la información de una parte de la organización se puede conciliar con la información de otra parte de la organización. Si dos iniciativas organizacionales tienen el mismo nombre, deben significar lo mismo. Por el contrario, dos medidas se marcan de manera diferente si tienen significados diferentes. Información consistente significa información de alta calidad. Esto significa que toda la información se explica y completa. Todo lo demás es un compromiso, así que queremos mejorar.
  • Es información adaptativa y flexible: los almacenes de datos están diseñados para el cambio continuo. Los datos y tecnologías existentes no se alteran ni destruyen cuando se realizan nuevas consultas al almacén de datos. Los datos y las tecnologías existentes tampoco se modifican ni destruyen cuando se agregan nuevos datos al almacén de datos. Es necesario difundir y ampliar el diseño de los data marts independientes que componen el almacén de datos. Todo lo demás es un compromiso, así que queremos mejorar.

Los elementos básicos de un Data WareHouse

Los elementos básicos de un data warehouse:

  • Los sistemas fuentes, también conocidos como sistemas operativos de registros o Legacy Systems, son aquellos que se encargan de capturar las transacciones del negocio. Estos sistemas funcionan como la fuente de datos primarios, registrando y almacenando la información transaccional.
  • El área de tráfico de datos es un espacio donde se almacenan y se llevan a cabo una serie de procesos para limpiar, transformar, combinar, eliminar duplicados, guardar, archivar y preparar los datos fuente antes de ser utilizados en el Data Warehouse.
  • El servidor de presentación es la máquina física que sirve como destino para organizar y almacenar los datos del Data Warehouse, con el fin de permitir consultas directas por parte de los usuarios finales, generar informes y utilizar otras aplicaciones relacionadas.
  • El modelo dimensional es una disciplina especializada en el diseño de modelos de datos que se presenta como una alternativa a los modelos de entidad-relación.
  • Los procesos de negocios son un conjunto coherente de actividades empresariales que tienen sentido para los usuarios del Data Warehouse.
  • Data Mart: un subgrupo lógico del Data WareHouse completo.
  • Un Data Warehouse es un sistema que busca y recopila fuentes de datos de toda la empresa. Además, actúa como la combinación de todos los data marts que lo conforman.
  • El almacenamiento operativo de datos es el punto de integración para los sistemas operativos, necesita acceso a los datos necesarios para la toma de decisiones por parte de los ejecutivos.

Los procesos básicos del Data WareHouse (ETL)

Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.

Transformación: una vez que la información es extraída hacia el área de tráfico de datos, hay posibles pasos de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.

...

Descargar como (para miembros actualizados) txt (15 Kb) pdf (1 Mb) docx (902 Kb)
Leer 9 páginas más »
Disponible sólo en Clubensayos.com