ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Diseñar vistas OLAP para satisfacer necesidades de información. Contenido:

Andrés ValleTutorial4 de Junio de 2017

2.260 Palabras (10 Páginas)303 Visitas

Página 1 de 10

Semana: 12

Tema 3: Carga y explotación de almacenes de datos

Laboratorio #9: Diseño de vistas OLAP.

Objetivo: Diseñar vistas OLAP para satisfacer necesidades de información. Contenido:

     Introducción.

     El lenguaje MDX.

     Preparación de las herramientas.

     Ejercicios de visualización y creación de vistas OLAP.

Desarrollo

Pentaho es “...una solución BI verdaderamente completa... Cualquiera interesado en BI debería echarle un vistazo a este software” [Pentaho Reviews, 2014]

Creación de vistas OLAP

OLAP es una manera de brindar rápidamente respuestas a consultas analíticas que son multidimensionales por naturaleza. Generalmente una o más dimensiones contienen datos agregados como el total o la suma. Pentaho incluye  un  renderizador  de  vistas  de  análisis  nombrado  ‘JPivot’  que  usa  el  motor  OLAP  de  Mondrian.  Este componente permite analizar interactivamente los datos del almacén de datos mediante una interfaz con estilo de tabla cruzada en las cuales las dimensiones pueden ser ubicadas. A diferencia de las herramientas de reporte, no es necesario definir una consulta, obtener los resultados y aplicarles estilo, aunque también es posible.

Esta vista permite aumentar el detalle de ciertas partes del cubo (drill down), organizar detalles a un nivel de resumen (roll up). Se pueden aplicar condiciones (slicing) y cambiar información de filas a columnas y viceversa, algo así como rotar el cubo y verlo desde diferentes ángulos (dicing).

Realizar drill down, roll up, slice y dice a una velocidad aceptable y de forma interactiva es lo que distingue a OLAP de otros tipos de análisis y reportes permitiendo a los usuarios analizar datos y encontrar excepciones. También permite obtener percepción del negocio.

¿Qué es OLAP? ¿Cómo se llama el renderizador de vistas de análisis incluido en Pentaho? ¿Cuáles son las diferencias entre las vistas de análisis y los reportes? ¿Cuáles son las operaciones más comunes sobre la vista de análisis?

De vuelta a MDX

MDX  es  el  acrónimo de  Multi Dimensional eXpression (Expresiones multi-dimensionales), que  es  un  lenguaje diseñado especialmente para consultar bases de datos OLAP. Es un estándar de facto desarrollado por Microsoft. En un sentido, MDX es para el modelo multidimensional lo que SQL es para el modelo relacional. Las consultas MDX operan en un cubo y entregan una colección de celdas multidimensionales. Aunque no es necesario ser un experto en MDX, ayuda conocer lo básico antes de iniciar la construcción de cubos.

(1) SELECT {[Measures].[acued_alcant]} ON COLUMNS,

(2) NON EMPTY {[dim_temporal_anno].[Anno].Members} ON ROWS (3) FROM [hech_acueducto_alcantarillado]

(4) WHERE {[dim_acueducto_alcantarillado].[Acueductos].[Extensión de la red]}

La primera línea contiene la palabra clave SELECT que inicia la sección de consulta. A continuación se coloca una colección de miembros seguida por las palabras clave ON COLUMNS, indicando que estos miembros se mostrarán en las columnas de la tabla cruzada. De igual manera en la línea 2 se coloca NON EMPTY (opcional) para que solo muestre los elementos no vacíos, seguido por una colección de miembros y las palabras clave ON ROWS para indicar que estos miembros se mostrarán en las filas de la tabla cruzada. La línea 3 contiene la palabra reservada


FROM seguida del nombre del cubo que se está consultando. La línea 4 incluye una cláusula WHERE seguida por una colección de restricciones, en forma de miembros específicos para filtrar (operación slice).

Nota: Para obtener más información consulte sobre el lenguaje MDX consulte los libros siguientes:

     Pentaho Solutions. Roland Bouman, 2009. Chapter 15.

     Mondrian Technical Guide. MDX Specification, Appendix A – MDX Function List. Julian Hyde,

2007.[pic 5]

     Microsoft SQL Server 2005 Analysis Services. Reed Jacobson, 2006. Part III.

     Applied Microsoft Analysis Services 2005. Teo Lachev, 2005. Part 3.

Publicando reportes y esquemas.

Los reportes creados con Pentaho Report Designer pueden ser publicados para su visualización, así como los esquemas OLAP que se crean usando la herramienta Pentaho Schema pueden ser publicados para construir aplicaciones de análisis. La herramienta que sirve de soporte para los reportes y aplicaciones de análisis es la Plataforma de Inteligencia de Negocios de Pentaho, conocida como Pentaho BI Server y Pentaho BA Server.

     El apéndice A, incluye los pasos para publicar esquemas en el Pentaho BI Server.

     El apéndice B, incluye los pasos para publicar reportes en el Pentaho BI Server.

Preparando Pentaho BI Server y Administration Console.

Hasta  la  versión  4.8  la  herramienta  Pentaho  BI  Server  Community Edition  está  formada  por  un  servidor  de aplicaciones y una consola de administración. En la consola de administración se crean los usuarios de acceso al servidor y se definen las conexiones a bases de datos o datasources que se usarán por las aplicaciones publicadas. El servidor de inteligencia de negocios constituye la plataforma para la visualización de vistas de análisis, reportes y demás herramientas de inteligencia de negocios.

Para que la consola de administración funcione correctamente, el servidor de Inteligencia de negocios este debe estar previamente iniciado. Debe copiar para la carpeta biserver-ce-4.8.0/biserver-ce/tomcat/lib el archivo postgresql-

9.1-902.jdbc4.jar, correspondiente al driver JDBC para PostgreSQL. Para poder publicar los reportes y esquemas,

debe modificar el archivo biserver-ce-4.8.0/biserver-ce/pentaho-solutions/system/publisher_config.xml y en la sección

password escribir la contraseña de publicación, en este caso password. Ejecute start-pentaho.bat si está usando Windows o “sh start-pentaho.sh” desde la consola de Linux. Debe esperar varios segundos (puede llegar a varios minutos dependiendo del hardware). Acceda escribiendo http://localhost:8080 desde el navegador.

Para registrar las bases de datos en la consola de administración, primero debe copiar para la carpeta biserver-ce-

4.8.0/administration-console/jdbc el archivo postgresql-9.1-902.jdbc4.jar, correspondiente al driver JDBC para PostgreSQL. Una vez hecho, ejecute el start-pac.bat si está usando Windows o desde la consola de Linux “sh start- pac.sh”. Recuerde que debe tener la máquina virtual de Java instalada. Acceda escribiendo http://localhost:8099 en el navegador. Un usuario por defecto es admin con la clave password. La imagen 1 muestra como adicionar nuevas bases de datos. Tenga presente que el nombre que use para la conexión debe ser consistente con la solución, es decir, el mismo que usa en los reportes y en el esquema.


[pic 6]

1 Configuración de una nueva conexión a base de datos

La imagen 2 muestra la vista inicial del servidor de BI de Pentaho. Un usuario por defecto es joe con la clave password. Puede definir usuarios con roles diferentes desde la consola de administración.

[pic 7]

2 Ventana de inicio de la plataforma de BI de Pentaho

La imagen 3 muestra la  vista principal del  servidor. Está compuesta por una barra de  menús, una  barra de herramientas (donde se encuentra activa la opción que visualiza el navegador de la izquierda), un navegador de soluciones y el área de trabajo; el cuadro inferior izquierdo muestra el contenido de las carpetas seleccionadas.

...

Descargar como (para miembros actualizados) txt (15 Kb) pdf (534 Kb) docx (947 Kb)
Leer 9 páginas más »
Disponible sólo en Clubensayos.com