Fichero o archivo
lololin90Apuntes6 de Octubre de 2022
4.331 Palabras (18 Páginas)77 Visitas
Unidad 1
Fichero o archivo: conjunto de información relacionada, tratada como un todo y organizada de forma estructurada. Es una secuencia de dígitos binarios que organiza información relacionada con un mismo aspecto.
Los ficheros están formados por registros lógicos que contienen datos relativos a un mismo elemento u objeto. Los registros están divididos en campos que contienen cada una de las informaciones elementales que forman un registro.
La cantidad de información que es transferida entre el soporte en él se almacena el fichero y la memoria principal del ordenador, en una sola operación de lectura/grabación, recibe el nombre de registro físico o bloque.
Un bloque suele contener varios registros lógicos. Al número de registros que entran en un bloque se le conoce con el nombre de factor de blocaje y a la operación de agrupar varios registros en un bloque se le llama bloqueo de registros.
Según la función que vaya a desempeñar se pueden clasificar en:
- Ficheros permanentes: contienen información relevante para una aplicación.
- Ficheros maestros: contienen el estado actual de los datos que pueden modificarse desde la aplicación.
- Ficheros constantes: son aquellos que incluyen datos fijos para la aplicación.
- Ficheros históricos: contienen datos que fueron considerados como actuales en un periodo o situación anterior.
- Ficheros temporales: Se utilizan para almacenar información útil para una parte de la aplicación.
- Ficheros intermedios: almacenan resultados de una aplicación que serán utilizados por otra
- Ficheros de maniobras: almacenan datos de una aplicación que no pueden ser mantenidos en memoria por falta de espacio.
- Ficheros de resultados: almacenan datos que van a ser transferidos a un dispositivo de salida.
Los ficheros se almacenan en soportes de información manejados por dispositivos periféricos, que permiten leer y grabar datos. Se distinguen dos tipos de soportes para el almacenamiento de datos:
- Soportes de acceso directo a los datos: El acceso a los datos puede hacerse de forma directa, pudiendo colocarnos en la posición que nos interesa y leer a partir de ella.
- Soportes de acceso secuencial: Se suelen usar en copias de seguridad y si deseamos leer un dato que está en mitad de la cinta, tendremos que leer todo hasta llegar a esa posición.
Tipos de organización de los ficheros:
- Ficheros secuenciales: Sus registros están almacenados de forma contigua, la forma de acceder a él es leyendo un registro tras otro desde el principio. Para determinar el final del fichero se indica con la marca (EOF). Los registros almacenados se identifican por medio de una información ubicada en uno de sus campos, denominado clave o llave. Otras características de estos ficheros son:
- La lectura siempre se realiza hacia delante
- No permiten el acceso simultaneo de varios usuarios
- Todos los registros deben aparecer siempre en el mismo orden
- El modo de apertura del fichero condiciona la lectura o escritura
- Aprovechan al máximo el soporte de almacenamiento
- Se pueden grabar en cualquier tipo de soporte
- Todos los lenguajes de programación pueden trabajar con ellos
- No se pueden insertar registros nuevos entre los que ya están grabados
- Ficheros de acceso directo: Se puede acceder a un registro indicándola posición relativa del mismo dentro del archivo usando una clave que forma parte del registro como un campo más. Cada uno de los registros se guarda en una posición física que dependerá del espacio disponible en la memoria. El campo clave es un campo que permite identificar y localizar un registro de manera ágil y organizada. Otras características de estos ficheros son:
- Posicionamiento inmediato
- Registros de longitud fija
- El fichero se puede leer y editar
- Permiten múltiples usuarios
- Los registros se borran colocando un cero
- Los archivos se crean con un tamaño definido
- Se usan cuando el acceso a los datos de un registro se hace siempre con la misma clave
- Permiten actualizar los registros en el mismo fichero
- Permiten realizar procesos de actualización en tiempo real
- Ficheros indexados: Se basan en la utilización de índices que permiten el acceso a un registro del fichero de forma directa sin tener que leer los anteriores. Se forma de una zona de registros en la que se encuentran los datos del archivo y una zona de índices que contiene una tabla con las claves de los registros y las posiciones donde se encuentran. Las características más relevantes son:
- No puede haber dos registros que tengan la misma información (Campo clave), un fichero puede tener más de un campo clave pero uno de ellos no admitirá valores duplicados y se le llama clave primaria
- Permite utilizar el modo de acceso secuencial y el modo de acceso directo para leer la información guardada
- Solo se puede grabar en un soporte direccionable
- Ficheros secuenciales indexados: está formado por una zona de índices y otra de registros de datos que se encuentra dividida en segmentos ordenados. Permite el acceso secuencial. Permite el acceso directo a los registros. Se pueden actualizar los registros en el mismo fichero. Ocupa más espacio en el disco que los ficheros secuenciales.
- Ficheros de acceso calculado o Hash: Permite accesos más rápido, para accederse utiliza una transformación o una función magnética, que a partir de la clave genera la dirección de cada registro del archivo. Algunos métodos para la transformación son:
- Modulo
- Extracción
Mediante la utilización de parámetros de referencia podremos determinar el uso de un fichero. Estos parámetros son:
- Capacidad o volumen: es el espacio que ocupa el fichero
- Actividad: permite conocer la cantidad de consultas y modificaciones que se realizan en el fichero. Para poder especificarla se debe tener en cuenta:
- Tasa de consulta o modificación: porcentaje de registros consultados o modificados
- Frecuencia de consulta o modificación: número de veces que se accede al fichero para hacer una consulta o modificación en un periodo de tiempo fijo
- Volatilidad: mide la cantidad de inserciones y borrados que se efectúan en un fichero. Para determinarlo es necesario conocer:
- Tasa de renovación: tanto por ciento de registros renovados en cada tratamiento del fichero respecto al número total de registros contenidos en el
- Frecuencia de renovación: número de veces que se accede al fichero para renovarlo en un periodo de tiempo fijo
- Crecimiento: variación de la capacidad del fichero y se mide con la tasa de crecimiento, es el porcentaje de registros en que aumenta el fichero en cada tratamiento
Una base de datos permitirá reunir toda la información relacionada en un único sistema de almacenamiento, pudiendo usarla cualquier aplicación de manera independiente y ofreciendo una mejora en el tratamiento de la información y una evolución para el desarrollo de aplicaciones.
Base de datos: Es una colección de datos relacionados lógicamente entre sí, con una definición y descripción comunes y que están estructurados de una determinada manera. Es un conjunto estructurado de datos que representa entidades y sus interrelaciones, almacenados con la mínima redundancia y posibilitando el acceso a ellos eficientemente por parte de varias aplicaciones y usuarios. También almacenan una descripción de dichos datos denominada metadatos que se almacenan en el diccionario de datos o catálogo.
Una base de datos constara de:
- Entidades: objeto real o abstracto con características diferenciadas de otros. Por ejemplo en una clínica veterinaria las posibles entidades pueden ser: doctor, consulta,…
- Atributos: son los datos que se almacenan en la entidad. Por ejemplo raza, color, nombre,…
- Registros: donde se almacena la información de cada entidad.
- Campos: donde se almacenan los atributos de cada registro.
Existen cuatro tipos de personas que pueden hacer uso de una base de datos:
- El administrador: persona encargada de la creación.
- Los diseñadores: personas encargadas de diseñar cómo será la base de datos.
- Los programadores de aplicaciones: se encargan de implementar los programas de aplicación que servirán a los usuarios finales. Estos programas son los que ofrecerán la posibilidad de realizar consultas de datos, actualización o eliminación de los datos.
- Los usuarios finales: Son los clientes finales de la base de datos.
Los sistemas de almacenamiento más utilizados son:
- Discos SATA
- Discos SCSI
- RAID
- Sistemas NAS: sistema de almacenamiento masivo en la red
- Sistemas SAN: Red concebida para conectar servidores, arrays de discos y librerías de soporte
Modelos de bases de datos:
- Modelo jerárquico: utiliza una estructura de árbol invertido para la organización de los datos. La información se organiza de una jerarquía en la que la relación entre las entidades de este modelo siempre es del tipo padre/hijo. Existen nodos que contienen atributos o campos y que se relacionaran con sus nodos hijos, pudiendo tener cada nodo más de un hijo, pero un nodo siempre tendrá un solo padre. Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos. Los segmentos se relacionan entre si utilizando arcos.
- Modelo en red: organiza la información en registros y enlaces. En los registros se almacenan los datos y los enlaces permiten relacionar estos datos. En estas bases de datos puede haber más de un padre.
- Modelo relacional: utiliza tabla bidimensionales (relaciones). Cada relación posee un nombre que es único y contiene un conjunto de columnas. Cada fila de la tabla se llamará registro, entidad o tupla y cada columna de la tabla será llamada campo o atributo. A los conjuntos de valores que puede tomar un determinado atributo se le denomina dominio. Una clave será un atributo o conjunto de atributos que identifique de forma única a un registro. Las tablas deben cumplir una serie de requisitos:
- Todos los registros son del mismo tipo.
- La tabla sólo puede tener un tipo de registro.
- No existen campos o atributos repetidos.
- No existen registros duplicados.
- No existe orden en el almacenamiento de los registros.
- Cada registro o tupla es identificada por una clave que puede estar formada por uno o varios campos o atributos.
- Modelo orientado a objetos: define una base de datos en términos de objetos, sus propiedades y sus operaciones. Los objetos con la misma estructura y comportamiento pertenecen a una clase, y las clases se organizan en jerarquías. Los conceptos más importantes de este modelo son:
- Encapsulación: permite ocultar la información al resto de los objetos
- Herencia: los objetos heredan comportamiento dentro de una jerarquía de clases
- Polimorfismo: propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.
- Modelo NoSQL: son sistemas de almacenamiento de información que no cumple con el esquema entidad-relación. Tampoco utilizan una estructura de datos en forma de tabla donde se van almacenando los datos sino que para el almacenamiento hacen uso de otros formatos como clave-valor. Las principales ventajas son:
- Se pueden ejecutar en máquinas con pocos recursos
- Pueden manejar gran cantidad de datos
- Se añaden más nodos para mejorar el rendimiento
- No genera cuellos de botella
Las principales diferencias con los sistemas SQL no:
- No utilizan SQL como lenguaje de consultas
- No utilizan estructuras fijas
- No suelen permitir operación JOIN
- La información puede estar compartida en varias máquinas mediante mecanismos de tablas Hash
Dependiente de la forma que almacena la información podemos encontrar varios tipos:
- Bases de datos clave-valor: cada elemento está identificado por una llave única
- Bases de datos documentales: almacena la información como un documento
- Bases de datos en grafo: la información se representa como nodos de un grafo y sus relaciones son las aristas del mismo.
- Modelo objeto-relacional: hibrido entre las bases del modelo relacional y del modelo orientado a objetos
- Modelo de bases de datos deductivas: almacenan la información y permiten realizar deducciones a través de inferencias. Se derivan nuevas informaciones a partir de las que se han introducido explícitamente en la base de datos por parte del usuario.
- Bases de datos multidimensionales: almacena sus datos con varias dimensiones, en vez de un valor encontramos varios dependiendo de los ejes definidos.
- Bases de datos transaccionales: caracterizadas por su velocidad para gestionar el intercambio de información.
Diferentes clasificaciones de las bases de datos:
- Bases de datos según su contenido
- Bases de datos con información actual
- Directorios
- Bases de datos documentales
- Bases de datos según su uso:
- Base de datos individual
- Base de datos compartida
- Base de datos de acceso publico
- Base de datos propietarios o bancos de datos
- Bases de datos según la variabilidad de la información
- Bases de datos estáticas
- Bases de datos dinámicas
- Bases de datos según la localización de la información
- Bases de datos centralizadas
- Basada en anfitrión
- Basada en cliente/Servidor
- Bases de datos distribuidas
- Bases de datos según el organismo productor
- Bases de datos de organismos públicos y de la administración
- Bases de datos de instituciones sin ánimo de lucro
- Bases de datos de entidades privadas o comerciales
- Bases de datos de uso interno
- Bases de datos de datos comerciales
- Bases de datos realizadas por cooperación en red
- Bases de datos según el modo de acceso:
- Bases de datos de acceso local:
- Bases de datos en CD-ROM
- Bases de datos en línea
- Acceso vía web
- Bases de datos según cobertura temática
- Bases de datos científico-tecnológicas
- Bases de datos económico-empresariales
- Bases de datos de medios de comunicación
- Bases de datos del ámbito político-administrativo y jurídico
- Bases de datos del ámbito sanitario
- Bases de datos para el gran publico
Sistemas gestores de bases de datos: conjunto coordenado de programas, procedimientos, lenguajes, etc, que suministra los medios necesarios para describir y manipular los datos contenidos en la base de datos, manteniendo su integridad, confidencialidad y seguridad.
...