Historia Bases De Datos
kmila12345628 de Mayo de 2014
17.433 Palabras (70 Páginas)319 Visitas
EL FUTURO DE LAS BASES DE DATOS Conclusiones
Niels Bohr
(c) Dr. Mario Piattini Velthuis
Por Mario Piattini
El Futuro de las Bases de datos(I)
Evolución y nuevos retos.
Con este artículo iniciamos una serie en la que presentaremos /as principales líneas de investigación y tendencias de mercado para los sistemas de bases de datos, que se han convertido en uno de los productos estratégicos más importantes para los Sistemas de Información.
Introducción
La historia de las bases se extiende desde mediados de los años sesenta, y se ha caracterizado por su excepcional productividad y su impresionante impacto económico. En efecto, en estos momentos, el mercado de las bases de datos ronda, según diversas fuentes, los 8.000 millones de dólares, con un crecimiento del 20% anual.
A estas cantidades hay que añadir las inversiones que hacen los usuarios en aplicaciones desarrolladas sobre SGBD (piénsese por ejemplo en el crecimiento espectacular de la empresa SAP). Así como las cuantiosas inversiones de los suministradores en I+D y marketing.
Otro factor que delata el impacto de las bases de datos en la industria es la repercusión de las adquisiciones que se llevan a cabo en esta área (por ejemplo, Ask/lngres por Computer Associates, o, mas recientemente, la de Ilustra-por parte de Informix), y los fichajes sonados que se hacen de los gurús de bases de datos (por ejemplo, la incorporación de Jim Gray a Microsoft).
Todo esto es debido a que las bases de datos se han convertido en un producto estratégico de primer orden, al constituir el fundamento de los sistemas de información, y soportar la gestión y la toma de decisiones.
Evolución de la gestión de datos
Desde que se empezaron a introducir los ordenadores para automatizar la gestión de las empresas en la década de los sesenta, empleando programas escritos en COBOL, la evolución de los sistemas de información ha tenido una considerable repercusión en la gestión de los datos, al exigirse cada vez mayores prestaciones de la información almacenada en el sistema.
Poco a poco, el centro de gravedad de la informática, que estaba situado en el proceso, se desplazo hacia la estructuración de los datos, siendo actualmente los aspectos relacionados con este tema un eje fundamental alrededor del cual gira una gran parte del conjunto de problemas con los que se enfrenta todo diseñador de un sistema de información.
Se cambia, por tanto, de sistemas orientados hacia el proceso a sistemas orientados hacia los datos, donde estos adquieren el protagonismo, pasando desde el plano más bien oscuro y difuso en el que estaban situados a ocupar un lugar privilegiado en el interés de todo informático.
Surge así, a finales de los sesenta y principios de los setenta, la primera generación de productos de bases de datos en red (basados en lo que posteriormente se conocería por modelos jerárquicos y Codasyl), entre los que destacaron por su impacto el IMS de IBM y el IOMS de Cullinet. Estos productos, si bien resultaban bastante eficientes, presentaban lenguajes procedimentales, que obligaban al programador a navegar (registro a registro) por
la base de datos, y que no disponían de la suficiente independencia físico/lógica, lo que conllevaba una escasa flexibilidad.
Cuando, en 1970, el Dr. Codd propuso el modelo relacional, no podía pensar que lo que se consideraba mas bien una elegante teoría matemática (un "juego”, según algunos) sin posibilidad de implementación eficiente en productos comerciales, iba a convertirse en los años ochenta, en un señuelo obligado en la promoción de todo SGBD. Aparece así la segunda generación de productos de bases de datos: ORACLE, DB2, INGRES, INFORMIX, SYBASE, etc. que presentan una mayor independencia físico/lógica, mayor flexibilidad y lenguajes de especificación (que actúan sobre conjuntos de registros). Este tipo de productos se ha ido imponiendo en el mercado y ha sido uno de los principales focos de investigación de los últimos tiempos.
Los trabajos de investigación que se realizaron durante la década de los ochenta se centraron en la optimización de consultas, lenguajes de alto nivel, teoría de la normalización, organizaciones físicas para el almacenamiento de las relaciones, algoritmos para la gestión de memorias intermedias (buffers), técnicas de indexación para un acceso asociativo mas rápido (distintas variaciones de los arboles B), sistemas distribuidos, diccionarios de datos, gestión de transacciones, etc. Estas investigaciones han tenido como consecuencia la elevada tasa de transacciones de muchos de los productos actuales que permiten asegurar entornos transaccionales en línea (OLTP) muy eficientes y seguros. También cabe recordar que durante la primera mitad de los ochenta se estandariza el lenguaje SQL (el SQL/ANS se aprueba en 1986), ofreciendo, al cabo de poco tiempo, prácticamente todos los productos una interfaz SQL, aún los no relacionales (sistemas "renacidos").
En los últimos años venimos asistiendo a un avance espectacular en la tecnología de bases de datos. Temas que hasta hace poco parecían exclusivos de laboratorios y centros de investigación, comienzan a aparecer en las ultimas versiones de algunos SGBD y en nuevos productos: bases de datos multimedia, activas, deductivas, orientadas a objetos, seguras, temporales, móviles, paralelas, difusas, etc., véase figura 1.
Figura 1.
Esta nueva generación de bases de datos (La "tercera"), se caracteriza por "proporcionar capacidades de gestión de datos al igual que sus predecesores, permitiendo que grandes cantidades de datos persistentes sean compartidos por muchos usuarios. También proporcionan gestión de objetos, permitiendo tipos de datos mucho más complejos, objetos multimedia, datos derivados, encapsulamiento de /a semántica de los datos, así como otras nuevas capacidades. Algunos proporcionan incluso gestión de conocimiento, soportando un gran número de reglas complejas para inferencia automática de información y también para mantener las restricciones de integridad entre datos”, CATTELL (1991).
Esta misma idea es la introducida por KHOSHAFIAN et al. (1990), que denomina a este nuevo tipo de SGBD "inteligente", definiéndolo como aquel que. “Gestiona Información de una manera natural, haciendo esta información fácil de almacenar, acceder y utilizar”. Para ello destaca la necesidad de:
♦ Un fuerte soporte para texto, imagen, VOZ, animación y vídeo.
♦ Un modelo de datos orientado a objetos, y
♦ Un soporte de reglas declarativas para expresar las interrelaciones semánticas entre
objetos.
Todos estos avances, tanto en el campo teórico como en el practico, se apoyan en dos elementos clave de los SGBD, la arquitectura y los modelos de datos, DE MIGUEL y PIATTINI (1993). Respecto a la arquitectura, las propuestas de ANSI e ISO en sus modelos de referencia han influido positivamente, no sólo en las investigaciones teóricas, sino también en las aplicaciones practicas. En gran parte de las normas de ISO, y de los productos, subyacen dos principios de los modelos de referencia, la arquitectura a tres niveles y la descripción recursiva de los datos.
En lo que se refiere a los modelos de datos, ha sido el modelo relacional el que ha marcado las líneas de investigación en los últimos veinticinco años y el que, como acabamos de señalar, se ha asentado en la mayoría de los productos actuales1. Aunque han surgido otros modelos, como los orientados al objeto, que presentan grandes ventajas para determinado tipo de aplicaciones, y cuyos conceptos también se empiezan a incorporar a los sistemas relacionales (extendidos).
Nuevos retos
Aun cuando se podría pensar que la tecnología de las bases de datos ha alcanzado ya su madurez, la tercera generación de bases de datos pone de manifiesto que no se conocen todavía las soluciones a los problemas de las bases de datos de los años 2.000.
Señales de preocupación
EI profesor Alejandro Buchmann ha señalado recientemente, en ocasión de las I Jornadas sobre Investigación y Docencia en Bases de Datos celebradas en A Coruña (Galicia), BUCHMANN (1996), que, a pesar del éxito que han experimentado las bases de datos, existen varias señales de preocupación, entre las que destacan que:
♦ Los SGBD son monolíticos.
♦ Existen mas datos en hojas de calculo que en SGBD.
♦ EI 50% de datos de producción se encuentran en sistemas heredados (legacy system)
♦ Los sistemas de gestión de flujos de trabajo (WFM, Work Flow Management) no están basados en tecnología de bases de datos. Necesitan bases de datos pero las ubican en la periferia del sistema a través de API (Interfaces de Programación de Aplicaciones).
1 Según previsiones de IDC, los SGBD orientados al objeto no superarán, este año, el 5% del mercado mundial de bases de datos.
♦ Muchas aplicaciones no necesitan mas que indexación de ficheros.
♦ Los servicios de réplica no escalan por encima de los 10.000 nodos.
♦ No se puede combinar datos estructurados y no estructurados. Por ejemplo, sería útil combinar el correo electrónico con una base de datos, y pedir al sistema las direcciones y los pedidos de los clientes que han enviado recientemente un mensaje por correo electrónico.
Cambios en el entorno empresarial
Según Peter Keen de la Hardware Business School (en su obra Shaping the Future"), una empresa capaz de cumplir sus objetivos en la sociedad actual debe ser "abierta" en el mas amplio sentido de la palabra, para lo que debe tener una serie
...