Organización De Archivos: Archivos Secuenciales.
KTMN25 de Abril de 2015
3.267 Palabras (14 Páginas)391 Visitas
.2. Los sistemas manejadores de bases de datos
Un sistema manejador de bases de datos (SMBD) es un software que permite insertar, modificar y recuperar eficazmente los datos específicos dentro de una gran masa de información compartida por muchos usuarios. Un SMBD se distingue claramente de un SMA porque el primero permite la descripción de los datos en forma separada de su utilización, es decir asegura la independencia de datos.
Una base de datos es un conjunto de datos gestionados por un SMBD y asociados a una misma aplicación. Como una primera aproximación a la estructura de un SMBD se presenta la figura I.19 que contiene una estructura en capas, donde la primera capa, el SMA, se encarga del manejo de la memoria secundaria. Luego, la segunda capa se ocupa del manejo de los datos almacenados en los archivos, de los enlaces entre los datos y las estructuras, y de la localización y ensamblaje de esos datos. Por último, la tercera capa es la encargada de presentar los datos a los programas de aplicación (PA), haciendo un análisis e interpretación de las consultas de los usuarios.
Figura I.19. Estructura inicial de un SMBD.
Regresar a los contenidos...
________________________________________
I.2.1.- Desarrollo de los SMBD
Como punto de inicio en la evolución del concepto de base de datos se toma el comienzo de la década de los sesenta. para esa época las computadoras manejaban sus E/S a través de programas de E/S y el procesamiento de los programas en el computador era únicamente en lotes. Los archivos eran secuenciales solamente, por lo que la distribución física de los datos estaba incorporada al PA y por ello, no había distinción entre archivo lógico y físico. Así, si se cambiaban las estructuras de datos o los dispositivos de almacenamiento, se debía cambiar, recompilar y probar de nuevo los PA. Esto implicaba que los datos eran diseñados para una única aplicación existiendo varias copias de los datos sin posibilidad de compartirlos y en consecuencia, se tenía una alta redundancia de datos en los sistemas de archivos de una organización, y como producto de esta redundancia, se tenía inconsistencia incontrolada en los datos almacenados. Esta inconsistencia se debía a las múltiples copias de los datos, no todas actualizadas de la misma manera, y que al momento de consultarlos arrojaban valores almacenados diferentes, sin poderse verificar cuál era el real.
A finales de los años 60 aparecen los métodos selectivos de acceso a los archivos, estos son el directo, aleatorio e indizado, el procesamiento de los programas se hace en lotes, en línea o en tiempo real, se pueden cambiar las unidades de almacenamiento de los datos sin cambiar los PA, aparecen los procesadores de E/S y se usan algunos recursos de seguridad de los datos. Además, se mantiene la tendencia de diseño de datos por aplicación y la redundancia de los mismos. En general, no hay recuperación de datos por claves múltiples, no hay administración de datos y si se necesitaban usar estructuras jerárquicas era necesario construirlas. Según la opinión de W. Kim en [Kim-91] los SMA desarrollados en esta época representan la primera generación, cuyos principales exponentes fueron el índice secuencial (ISAM) y el virtual (VSAM).
Entre los años 70 y 80 se comercializan los primeros SMBD, que permiten el acceso a los datos de diferentes maneras según lo indique el PA, los datos son compartidos, la organización física de los mismos es más independiente de los PA y es hecha con estructuras de datos complejas, que no se reflejan en los PA, los datos son direccionables a nivel de campo y grupo de datos, hay recuperación por clave múltiple y administración de datos. El SMBD provee los medios para reducir la redundancia, conservar la integridad y darle seguridad a los datos, así como también el soporte de lenguajes de descripción de datos y los de manipulación de los mismos.
Al inicio de los años 70 se señala la aparición de la segunda generación de SMBD, caracterizada por la separación de los datos del PA y la llegada de los lenguajes de acceso navegacionales y cuyo mejor exponente es el SMBD denominado IMS de la compañía IBM, basado en el modelo jerárquico.
La tercera generación está representada por los SMBD basados en el modelo de redes y cuya estructura fue normalizada por el grupo CODASYL. Los mejores exponentes de este grupo son: IDSS, IDMS y ADABAS. Estas dos generaciones comparten el uso de lenguajes de acceso navegacionales, pues desde un tipo de registro es posible acceder a otros tipos de registros hijos o enlazados al primero.
La cuarta generación aparece luego de los años 70, con el modelo relacional que simplifica el acceso a los datos para los usuarios externos. Estos sistemas han sido comercializados al inicio de los años 80 y cuyos mejores exponentes son: el sistema R y DB2 de la compañía IBM e INGRES desarrollado en la Universidad de Berkeley-California y comercializado por Rational Technology, Inc. A esta generación se le conoce también como tecnología de bases de datos relacionales, y ella está caracterizada por el uso de lenguajes de interrogación o de consulta declarativos, es decir lenguajes donde no es necesario colocar explícitamente como encontrar los datos, sino que basta indicar que datos se desean obtener, dejando al SMBD la tarea de encontrarlos y mostrarlos.
Una quinta generación se encuentra en desarrollo actualmente. Ella está caracterizada por un modelo de datos más rico y amplio, que puede soportar una gran cantidad de aplicaciones como: diseño y manufactura asistido por computador (CAD/CAM), diseño de software asistido por computador (CASE), sistemas de información geográfica (SIG), etc. Ellos poseen una amplia gama de facilidades o útiles necesarios para apoyar dichas aplicaciones. Entre sus principales exponentes están: POSTGRES basado en el enfoque relacional extendido y los SMBD orientados por objetos (SMBDOO) como son: ORION, GemStone, O2, ONTOS, Jasmine, Poet, etc.
La evolución del concepto de base de datos puede observarse en forma resumida en la tabla I.2.
Inicio de los años 60. Finales de los 60 (SMA) Años 70 y 80. 2da. 3ra. y 4ta. generación de SMBD. Años 90. 5ta. generación de SMBD.
Sólo archivos secuenciales. Aparecen los métodos de acceso. Se mantienen los métodos de acceso. Se mantienen los métodos de acceso.
Procesamiento en lotes. Procesamiento en lotes, en línea o en tiempo real Procesamiento distribuido y/o paralelo. Se mantienen todos los tipos de procesamiento.
Archivo lógico = físico. Diferencia entre archivo lógico y físico. Tipos básicos de datos: entero, real, carácter, fecha, etc. Otros tipos de datos: imágenes, audio, voz, animación, etc.
Dependencia lógica y física. Independencia física. Hay independencia lógica, física y de localización. Manejo de objetos compuestos y complejos.
No hay compartición de datos. No hay compartición de datos. Compartición de datos. Manejo de cualquier tipo de datos.
Alto nivel de redundancia de datos. Se mantiene la redundancia de datos. Redundancia de datos controlada. No redundancia. Soporte de evolución del esquema.
Hay inconsistencia de datos. Se mantiene la inconsistencia de datos. Inconsistencia de datos controlada. Manejo de versiones y reglas.
No hay recursos de seguridad. Se usan algunos recursos de seguridad. Manejo de la integridad y seguridad de datos. Transacciones de larga duración y cooperativas.
Datos direccionables a nivel de archivos. Datos direccionables a nivel de registros. Datos direccionables a nivel de campo y grupo. Encapsulación de datos y de programas.
Lenguajes de programación con las primitivas de manejo de archivos. El SMA tiene sus primitivas de manejo de archivos utilizadas desde los lenguajes. Aparecen los lenguajes declarativos de descripción y de manipulación de datos. Uso de los lenguajes orientados por objetos para descripción y manipulación de objetos
No hay recuperación por varias claves. No hay recuperación por varias claves. Hay recuperación por varias claves concatenadas o no. Adicionalmente hay recuperación por el identificador del objeto
Tabla I.2. Evolución del concepto de bases de datos.
Regresar a los contenidos...
________________________________________
I.2.2.- Objetivos de un SMBD
Las objetivos de un SMBD se enumeran a continuación:
1. Independencia física: debe permitir la realización de estructuras de almacenamiento de datos en forma independiente de su estructura lógica en la realidad. Las ventajas de esto son: los cambios en la estructura lógica no implican cambios en la de almacenamiento, las consideraciones sobre el mejor manejo de los datos almacenados quedan a cargo del SMBD y los cambio en la estructura de almacenamiento no implican cambios en los PA.
2. Independencia lógica: debe permitir una cierta independencia entre los datos vistos por las aplicaciones y la estructura lógica de ellos en la realidad. Sus ventajas son el soporte de la evolución de los datos y que cada grupo de trabajo vea esos datos como cada grupo lo desea. La figura I.20 ilustra este concepto, donde hay tres grupos de la organización que tienen definidas sus vistas de la base de datos que está almacenada en disco.
Figura I.20. Independencia lógica.
3. Manipulación de los datos por personas no especializadas en computación: se logra permitiendo que cualquier persona consulte y actualice (si está autorizada) los datos en la base de datos, por medio de lenguajes de programación no procedimentales, que permiten expresar lo que se desea obtener, sin describir la forma de hacerlo.
4. Eficacidad
...