Business Inteligence
Nessliver19 de Octubre de 2013
2.314 Palabras (10 Páginas)392 Visitas
BI
Definición:
Proceso interactivo para explorar y analizar información estructurada sobre un área para descubrir tendencias o patrones.
Se pretende convertir datos en información y con a información generar conocimiento
Áreas de BI:
• Clientes
• Proveedores
• Productos
• Servicios
• Competidores
Beneficios:
• Ayuda a toma de decisiones
• Reducir incertidumbre
Tipos de beneficios:
• Tangibles
• Intangibles
• Estratégicos
Componentes BI:
• Fuentes de información
• Proceso ETL(Extracción, Transformación y Carga)
• Data Warehouse
• Motor OLAP
• Herramientas de visualización
Fuentes de información:
• Sistemas operacionales o transaccionales
• Sistemas de información departamentales
• Fuentes de información externa
Información Estructurada.- Cuando conocemos la frecuencia y magnitud de un factor
Información no estructurada.-Cuando no se conoce cuándo ocurrirá un evento o sus características
Calidad de datos
CARACTERISTICAS:
• Precisión
• Integridad
• Coherencia
• Totalidad
• Validez
• Disponibilidad
• Accesibilidad
ETL Extract-Transform-Load
Proceso que organiza el flujo de datos entre los diferentes sistemas
Pasos del proceso:
1. Extrae datos de múltiples fuentes
2. Transforma los datos en un nuevo formato
3. Carga los datos en las estructuras de destino
DATA WAREHOUSE
Es una colección de información creada para soportar las aplicaciones de toma de decisiones
Características:
• Orientado a un área especifica
• Integrado
• Indexado
• Conjunto no volátil de información
Data Mart
Dirigidos a una comunidad de usuarios dentro de la organización (departamento, nivel organizativo, etc.)
Data mart independientes: Alimentados directamente de los orígenes de la información
Data mart dependientes: Se alimentan desde el data warehouse corporativo
Metadata.- Es el repositorio central de la información
Factores para un Data Warehouse:
• Tamaño
• Complejidad de esquemas de datos
• Numero de usuarios concurrente
• Complejidad de consultas
Se debe de asegurar:
• Alta disponibilidad
• Rendimiento
• Copias de seguridad y recuperación
• Recuperación física en caliente
CALIDAD DE LOS DATOS, CORRECCIÓN Y DETECCIÓN DE LOS ERRORES
La calidad de los datos se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes en empresas y organismos.
Dificultades:
• Cambios continuos y las rápidas implementaciones de sistemas
• Falta de conocimiento de la situación real
• Falta de conciencia sobre la importancia del tema
Objetivos:
• Ahorrar costos directos
• Potenciar acciones de marketing y gestión
• Mejorar capacitación y fidelización de los clientes
• Mejorar imagen corporativa
• Mejorar el servicio
Procesos detección y corrección de errores
Data Profiling.- Proceso de evaluación de los datos
• Metodología:
• Análisis de elementos
• Análisis de la estructura
• Verificación de reglas del negocio
• Análisis estadístico
Data Cleansing.- Proceso de limpieza de datos
Metodología:
• Análisis
• Transformación de datos
• Eliminación de duplicados
• Método estadístico
Detección de errores:
• Evaluación de datos
• Depuración o limpieza de datos
• Datos de negocio internos
• Correspondencia y fusión
• Ampliación
• Seguimiento/Monitorización
• Integración de los datos
• Rendimiento
• Producción
• Auditorias periódicas
• Gestión de la excepción
Aspectos críticos:
• Analizar e identificar los datos
• Calidad de los datos
• Integración de los datos
• Enriquecer los datos
• Monitorización de los datos
Beneficios:
• Datos maestros
• Datos de activos
• Datos de transacciones
• Mejora de procesos
• Reducción de costes
• Restricciones de tiempo y recursos
• Mayores radios de éxito al combinar datos
TOMA DE DESCIONES
Requisitos:
• Definir restricciones y limitaciones
• Relación costo-beneficio, especificando los rendimientos esperados
• Definir tipo de método
• Conocer los factores internos formales de la organización y los informales
• Conocer los factores externos de la organización
Clasificación de las decisiones:
• Estructuradas.- Las que se toman frecuentemente y se pueden tomar de acuerdo con políticas, procedimientos o reglas
• No estructuradas.- Son decisiones que se toman en problemas o situaciones de poca frecuencia y requieren una solución única
Diccionario de datos
En la mayoría de los sistemas del mundo real que se trabajan, los paquetes o elementos de datos, son suficientemente complejos como para que se necesite una descripción de ellos en otros términos. Elementos de datos complejos son definidos en términos de elementos de datos más simples y elementos de datos simples están definidos en términos de unidades legítimas y los valores que pueden tomar.
Existen muchos esquemas de notación comunes usados por analistas de sistemas, el mostrado aquí abajo es de los más comunes y usa símbolos simples:
= Es compuesto por
+ Y
() Opcional
{} Iteración
[] Selección entre varas opciones
** Comentario
@ Identificador
| Separa las opciones
Ejemplo:
Nombre-Completo = Titulo + Nombre + Apellido
Titulo = [Sr. | Srta. | Sra. | Dr. | Profesor]
Nombre = {carácter-valido}
Apellido = {carácter-valido}
Carácter-valido = [A-Z|a-z|0-9|'|-| | ]
El diccionario de datos guarda y organiza los detalles del Diagrama de Flujo de Datos(DFD). Es el segundo componente del análisis estructurado. También se conoce como “Data Repository”. Incluye el contenido de los data flow, los data store, las entidades externas y los procesos.
Data elements(Elementos de datos)
Es la parte más pequeña de los datos que tiene significado en el sistema de información. Se combinan varios elementos de datos para hacer los records o “data structures”. Ejemplo: nombre, dirección, seguro social.
Data Structure(Estructura de datos)
También se conocen como record. Es la combinación de elementos de datos relacionados que se incluyen en un flujo de datos o se retiene en un “data store”.
En un sistema medio o largo el diccionario de datos puede representar una cantidad formidable de trabajo. No es raro ver un diccionario de datos con varias miles de entradas, incluso un sistema relativamente simple tendrá varios cientos de entradas. Por esto se debe de prestar atención a la manera que el diccionario debe de ser desarrollado, en caso contrario el trabajo puede ser demasiado para el analista de sistemas.
Documentación:
Data elements - Las características que se describen en el diccionario de datos son:
1. Name - Es el nombre del elemento de datos; debe ser significativo.
2. Alias - Cualquier otro nombre que se pueda usar para referirse al elemento de datos. Por ejemplo, el nombre de un elemento de datos puede ser Balance actual, y el alias puede ser Deuda. Solo se incluye el alias si realmente es necesario utilizarlo.
3. Type y Size - Type o tipo se refiere a si el elemento de datos contiene valor numérico, caracteres o alfabético. Size o tamaño se refiere al máximo de caracteres o de dígitos que puede tener el elemento de datos.
4. Output format o edit mask - Indica cómo se presenta el dato al mostrarse en pantalla o al imprimirse en un reporte. Por ejemplo, el número de teléfono del cliente se puede guardar en el disco usando solo números 7878889999, pero presentarse editado en la pantalla o en el reporte (787) 888-9999.
5. Default value - Es el valor que el elemento de datos tiene si no se cambia entrando otro valor.
6. Prompt, column header o field caption - Es el nombre que se presenta en la pantalla o el título del dato en el reporte.
...