Proyecto de DW/BI
jimy mallquiEnsayo26 de Junio de 2020
3.381 Palabras (14 Páginas)155 Visitas
- Planificación del proyecto / programa El primer recuadro de la hoja de ruta se centra en poner en marcha el programa / proyecto, incluido el alcance, justificación y dotación de personal. A lo largo del ciclo de vida, tareas continuas de gestión de programas y proyectos. En este proceso se determina el proyecto de DW/BI con el propósito y sus objetivos manteniendo el camino de las actividades y una primera aproximación a las necesidades de información, tomando en cuenta el costo. Este proceso esta conformada por las siguientes acciones: Definir el alcance, definir las tareas, identificar y programar las tareas, planificar el uso de recursos, asignar la carga a los recursos, elaboración de documentos.
Estas actividades lo monitoreamos y rastreamos los problemas direccionadas por la empresa y el área de ti, comenzando por el usuario final y utilizando las mejores prácticas, aplicando la inteligencia empresarial, un término que ha surgido y evolucionado en los últimos años y que ahora es frecuente, que se utiliza para describir todos los sistemas y procesos que utiliza una empresa para reunir, procesar y proporcionar acceso y analizar información comercial. Se debe planificar cuidadosamente la arquitectura ETL y usar dimensiones conformadas para la integración y usar procedimientos incrementales debido a que, el problema con el enfoque de cascada para proyectos DW / BI es que lleva demasiado tiempo y no reconocer la necesidad de adaptarse a los nuevos requisitos o cambios en la comprensión.
Comenzamos este capítulo enfocándonos en el equipo del proyecto, su papel como editores de información y las realidades a veces insuperables que confrontan Luego dirigimos nuestra atención a todas las partes interesadas comerciales importantes.
El trabajo del administrador del almacén de datos es potencialmente enorme, ofreciendo muchas oportunidades y muchos riesgos, el administrador del almacén de datos debe interpretar y entregar ese activo al resto de la organización de una manera que lo haga más útil.
- Definición de requisitos, este proceso se centra en técnicas para obtener de manera efectiva los requisitos del negocio partes interesadas y representantes. La definición de requerimientos, es un proceso de entrevistar al personal de negocio y técnico, aunque siempre conviene, tener un poco de preparación previa. Toca el valor del perfil de datos temprano en su DW / BI proyecto, luego describe la importancia de organizar las necesidades de la empresa en torno a la organización áreas temáticas del proceso central, es una tarea clave en el ciclo de vida de Kimball porque estos hallazgos impulsan la mayoría de las decisiones hacia un cuadro positivo o negativo. Se recopilan requisitos para determinar los factores clave, impactando el negocio, se identifican las principales oportunidades en toda la empresa, se priorizan según el valor comercial y la viabilidad, y luego se recopilan requisitos detallados para la primera iteración del sistema DW / BI pista de inteligencia empresarial. Mientras que algunos miembros del proyecto están inmersos en la tecnología y los datos, otros se centran en identificar y la construcción de una amplia gama de aplicaciones de BI, incluidos informes estandarizados, parametrizados
consultas, paneles, cuadros de mando, modelos analíticos y aplicaciones de minería de datos, junto con el interfaz de navegación asociadas al despliegue, mantenimiento y crecimiento. Adicionalmente se deben equilibrar los requisitos y las realidades de la organización.
[pic 1]
Figura: La intersección de los requisitos y realidades del negocio.
Este enfoque nos ayuda a no tener enfoques sobredimensionadas que no logran entregar lo que el negocio necesita, llevado a un extremo, estos equipos centrados en los requisitos no pueden cumplir porque lo que el negocio quiere es inalcanzable.
Para identificar procesos de negocios usamos cuatro procesos que son los siguientes:
Identifique el proceso de negocio, el grano, las dimensiones y los hechos. Mientras esto suena sencillo, los equipos a menudo tropiezan en el primer paso. Luchan por articular el proceso de negocio, ya que es un término que parece tener diferentes significados según el contexto. Porque la declaración del proceso de negocio es la primera participación en el terreno cuando se diseña una dimensión modelo.
La relación entre iniciativas comerciales estratégicas y Procesos de negocios, el negocio está enfocado en las iniciativas comerciales estratégicas, y el equipo de DW / BI está enfocado en procesos de negocio creando una desconexión. Como parte del negocio proceso de recopilación de requisitos, el equipo DW / BI necesita desglosar o descomponer la estrategia iniciativa empresarial en sus procesos empresariales de apoyo. Los puntos de intersección en la marca de matriz donde los datos del proceso de negocio son necesarios para soportar las iniciativas estratégicas de negocios, como se ilustra en la Figura 2. La integración de iniciativas comerciales estratégicas y procesos comerciales brinda más claridad sobre dónde comenzar el proyecto de análisis y por qué. Mantiene el enfoque de implementación probado y verdadero de la construcción su almacén de datos un proceso de negocio a la vez, reduciendo el tiempo de entrega y eliminando datos redundancia, al tiempo que proporciona la base necesaria para apoyar aquellas iniciativas que el negocio ha considerado importante.
[pic 2]
Figura2: Matriz de procesos empresariales mapeados a iniciativas empresariales estratégicas.
- Arquitectura de datos
El modelado normalizado es una técnica poderosa para diseñar sistemas de procesamiento de transacciones en entornos relacionales. La normalización de las estructuras de datos físicos ha contribuido en gran medida a la
Éxito fenomenal de obtener grandes cantidades de datos en bases de datos relacionales. Sin embargo, los modelos normalizados a la tercera forma normal no contribuyen a la capacidad de los usuarios para consultar los datos.
Modelo dimensional versus modelo normalizado desafortunadamente, la dependencia de la normalización de 3NF prolifera las tablas sin pensar. Cada tienda de TI que
ha construido un modelo normalizado de un proceso comercial importante (como las ventas) tiene un aspecto similar mapa que cubre la mayor parte de una pared. Hay cientos de tablas conectadas por un número aún mayor de
Unir caminos. El resultado es abrumador y, desde la perspectiva del usuario empresarial, inutilizable. No humano
ser o software de computadora puede analizar un diagrama de entidad-relación normalizado en su totalidad.
Los diagramas ER son útiles, pero están destinados a verse en pequeñas secciones, no todas a la vez.
[pic 3]
Figura3: Un modelo dimensional para las ventas de supermercados.
las restricciones dimensionales son tan débiles que tiene una lista irrazonablemente larga de candidatos compuestos
llaves. "Irracionalmente largo" debe ser varias veces el número de registros reales en la tabla de hechos. A
en este punto, y antes de intentar escanear el índice, se rescata a un escaneo de relaciones en el que
mire cada registro de la tabla de hechos sin usar ningún índice.
[pic 4]
Figura4: Dos representaciones de una dimensión del producto: la versión superior nevada se normaliza a 3NF, y el fondo se desnormaliza en una dimensión plana.
Un manifiesto de modelado dimensional
El modelado dimensional (DM) es el nombre de una técnica de diseño lógico que a menudo se usa para almacenes de datos.
Es diferente y contrasta con el modelado normalizado, que puede tener hasta cinco niveles de normalización. En aras de la brevedad, elegiremos el nivel de normalización más común (tercero) y designar todos estos enfoques como 3NF. Este artículo señala las muchas diferencias entre dos técnicas de modelado y dibuja una línea en la arena: DM es la única técnica viable para bases de datos que están diseñados para admitir consultas de usuarios comerciales en un almacén de datos. 3NF es muy útil para captura de transacciones y anuncio de datos
- Fundamentos de modelado dimensional
El modelado dimensional es una disciplina de diseño que abarca el modelo relacional formal y en realidades de ingeniería de texto y datos numéricos. Comparado con la tercera forma normal entidad-relación modelado, es menos riguroso (permitiendo al diseñador más discreción en la organización de las tablas), pero más práctico porque se adapta a la complejidad de la base de datos y mejora el rendimiento. Dimensional
el modelado tiene una amplia cartera de técnicas para manejar situaciones del mundo real.
El modelado dimensional comienza dividiendo el mundo en medidas y contexto. Las mediciones son generalmente numéricos y tomados repetidamente. Las medidas numéricas son hechos. Los hechos siempre están rodeados de un contexto principalmente textual que es cierto en el momento en que se registra el hecho. Los hechos son atributos numéricos específicos y bien definidos. Por el contrario, el contexto que rodea los hechos es abierto y detallado. No es raro que el diseñador agregue contexto a un conjunto de hechos en la mitad del proceso.
...