ESTADO DEL ARTE - CALIDAD DE DATOS
Carlos Eduardo Ossa QuinteroEnsayo27 de Marzo de 2016
579 Palabras (3 Páginas)200 Visitas
ESTADO DEL ARTE
CALIDAD DE DATOS
INTRODUCCIÓN
La calidad de los datos en la información extraída de bases de datos es un tema que solo hasta ahora se está tomando en serio en muchas empresas, ya que esta se está convirtiendo en un gran activo, no solo el suministrar información a tiempo hacen que una empresa sea solida sino que también se está tomando en cuenta la calidad de esos datos para la toma de decisiones y es ahí en donde las bases de datos toman mayor peso, en donde la información debe ser confiable y real, la calidad en los datos juega un papel importantísimo en toda empresa es de ahí donde se puede perder o ganar mucha credibilidad y respeto.
Las nuevas tecnologías permiten un mayor desarrollo en aplicación de indicadores que permiten verificar la calidad de los datos, muchos artículos se han centrado únicamente en los errores que pueda tener la información, actualmente el tema está tomando mayor peso, es el usuario quien cada día hace más preguntas obligando a las empresas a evaluar sus bases de datos para satisfacer las necesidades en forma concreta y ágil.
Los administradores de bases de datos también están tomando mayor conciencia en este tema, están previendo y evitando errores con el fin de minimizar costos, y mejorar sus sistemas.
INDICADORES DE CALIDAD
En la actualidad existen indicadores que evalúen la calidad de los datos.
Se podrían citar algunos:
Las fuentes de selección:
Que pueden ser históricos recopilados en las bases de datos por la empresa, y que pueden contener campos muy significativos para unos y pocos importantes para otros, y a la vez pueden presentar falencias de datos de acuerdo a su antigüedad.
La accesibilidad a estos datos:
Con el correr del tiempo las tecnologías van avanzando y en muchos casos el tener información guardada en medios que se han avanzado tecnológicamente impide que los datos sean extraídos en su totalidad convirtiéndolos en obsoletos.
La amigabilidad de los datos:
La presentación agradable de la información, para una mejor comprensión de los datos.
Generalmente las empresas no cuentan con aplicaciones únicas para cada dependencia del negocio, sino que pueden tener replicaciones y distintos sistemas para atender un mismo conjunto de operaciones, y en esos casos es probable que las bases de datos de los sistemas operacionales contengan datos duplicados, a veces erróneos, innecesarios o incompletos. A esto se le suman los posibles errores a la hora de la entrada de datos a los sistemas de datos operacionales.
Algunas empresas internacionales han implementado sus propios sistemas de limpieza de datos para un ambiente data Warehouse entre ellas Intel (Hillsboro) quien inicialmente tomo la iniciativa de implementar un sistema de limpieza, pero debido a algunas dificultades que se le presentaron busco a un tercero con el que tampoco tuvo mucho éxito y finalmente lo implemento desde Oracle en el que mediante procedimientos almacenados programaban tareas de limpieza en periodos determinados.
La implementación de herramientas para la optimización de limpieza de datos acarrea costos muy elevados impidiendo que muchas empresas tengan accesibilidad a estos.
Según la revista COMPUTACION Y SISTEMAS (CyS) de México en su publicación 2010 sobre Evaluación de Calidad de Datos de Datos Integrados por Agregación de Calidad de sus antepasados, en donde exponen que la mayoría de los sistemas de bases de datos existentes se basan en la "presunción de perfección". Esto es inapropiado porque sabemos que no todos los datos en una base de datos son necesariamente perfectos, "los datos del mundo real es sucia" (Hernández, 1998).
Bibliografía
http://www.ongei.gob.pe/publica/metodologias/Lib5084/2241.HTM
...