Fichero o archivo

lololin90Apuntes6 de Octubre de 2022

4.331 Palabras (18 Páginas)112 Visitas

Página 1 de 18

Unidad 1

Fichero o archivo: conjunto de información relacionada, tratada como un todo y organizada de forma estructurada. Es una secuencia de dígitos binarios que organiza información relacionada con un mismo aspecto.

Los ficheros están formados por registros lógicos que contienen datos relativos a un mismo elemento u objeto. Los registros están divididos en campos que contienen cada una de las informaciones elementales que forman un registro.

La cantidad de información que es transferida entre el soporte en él se almacena el fichero y la memoria principal del ordenador, en una sola operación de lectura/grabación, recibe el nombre de registro físico o bloque.

Un bloque suele contener varios registros lógicos. Al número de registros que entran en un bloque se le conoce con el nombre de factor de blocaje y a la operación de agrupar varios registros en un bloque se le llama bloqueo de registros.

Según la función que vaya a desempeñar se pueden clasificar en:

Ficheros permanentes: contienen información relevante para una aplicación.

Ficheros maestros: contienen el estado actual de los datos que pueden modificarse desde la aplicación.
Ficheros constantes: son aquellos que incluyen datos fijos para la aplicación.
Ficheros históricos: contienen datos que fueron considerados como actuales en un periodo o situación anterior.

Ficheros temporales: Se utilizan para almacenar información útil para una parte de la aplicación.

Ficheros intermedios: almacenan resultados de una aplicación que serán utilizados por otra
Ficheros de maniobras: almacenan datos de una aplicación que no pueden ser mantenidos en memoria por falta de espacio.
Ficheros de resultados: almacenan datos que van a ser transferidos a un dispositivo de salida.

Los ficheros se almacenan en soportes de información manejados por dispositivos periféricos, que permiten leer y grabar datos. Se distinguen dos tipos de soportes para el almacenamiento de datos:

Soportes de acceso directo a los datos: El acceso a los datos puede hacerse de forma directa, pudiendo colocarnos en la posición que nos interesa y leer a partir de ella.
Soportes de acceso secuencial: Se suelen usar en copias de seguridad y si deseamos leer un dato que está en mitad de la cinta, tendremos que leer todo hasta llegar a esa posición.

Tipos de organización de los ficheros:

Ficheros secuenciales: Sus registros están almacenados de forma contigua, la forma de acceder a él es leyendo un registro tras otro desde el principio. Para determinar el final del fichero se indica con la marca (EOF). Los registros almacenados se identifican por medio de una información ubicada en uno de sus campos, denominado clave o llave. Otras características de estos ficheros son:

La lectura siempre se realiza hacia delante
No permiten el acceso simultaneo de varios usuarios
Todos los registros deben aparecer siempre en el mismo orden
El modo de apertura del fichero condiciona la lectura o escritura
Aprovechan al máximo el soporte de almacenamiento
Se pueden grabar en cualquier tipo de soporte
Todos los lenguajes de programación pueden trabajar con ellos
No se pueden insertar registros nuevos entre los que ya están grabados

Ficheros de acceso directo: Se puede acceder a un registro indicándola posición relativa del mismo dentro del archivo usando una clave que forma parte del registro como un campo más. Cada uno de los registros se guarda en una posición física que dependerá del espacio disponible en la memoria. El campo clave es un campo que permite identificar y localizar un registro de manera ágil y organizada. Otras características de estos ficheros son:

Posicionamiento inmediato
Registros de longitud fija
El fichero se puede leer y editar
Permiten múltiples usuarios
Los registros se borran colocando un cero
Los archivos se crean con un tamaño definido
Se usan cuando el acceso a los datos de un registro se hace siempre con la misma clave
Permiten actualizar los registros en el mismo fichero
Permiten realizar procesos de actualización en tiempo real

Ficheros indexados: Se basan en la utilización de índices que permiten el acceso a un registro del fichero de forma directa sin tener que leer los anteriores. Se forma de una zona de registros en la que se encuentran los datos del archivo y una zona de índices que contiene una tabla con las claves de los registros y las posiciones donde se encuentran. Las características más relevantes son:

No puede haber dos registros que tengan la misma información (Campo clave), un fichero puede tener más de un campo clave pero uno de ellos no admitirá valores duplicados y se le llama clave primaria
Permite utilizar el modo de acceso secuencial y el modo de acceso directo para leer la información guardada
Solo se puede grabar en un soporte direccionable

Ficheros secuenciales indexados: está formado por una zona de índices y otra de registros de datos que se encuentra dividida en segmentos ordenados. Permite el acceso secuencial. Permite el acceso directo a los registros. Se pueden actualizar los registros en el mismo fichero. Ocupa más espacio en el disco que los ficheros secuenciales.
Ficheros de acceso calculado o Hash: Permite accesos más rápido, para accederse utiliza una transformación o una función magnética, que a partir de la clave genera la dirección de cada registro del archivo. Algunos métodos para la transformación son:

Modulo
Extracción

Mediante la utilización de parámetros de referencia podremos determinar el uso de un fichero. Estos parámetros son:

Capacidad o volumen: es el espacio que ocupa el fichero
Actividad: permite conocer la cantidad de consultas y modificaciones que se realizan en el fichero. Para poder especificarla se debe tener en cuenta:

Tasa de consulta o modificación: porcentaje de registros consultados o modificados
Frecuencia de consulta o modificación: número de veces que se accede al fichero para hacer una consulta o modificación en un periodo de tiempo fijo

Volatilidad: mide la cantidad de inserciones y borrados que se efectúan en un fichero. Para determinarlo es necesario conocer:

Tasa de renovación: tanto por ciento de registros renovados en cada tratamiento del fichero respecto al número total de registros contenidos en el
Frecuencia de renovación: número de veces que se accede al fichero para renovarlo en un periodo de tiempo fijo

Crecimiento: variación de la capacidad del fichero y se mide con la tasa de crecimiento, es el porcentaje de registros en que aumenta el fichero en cada tratamiento

Una base de datos permitirá reunir toda la información relacionada en un único sistema de almacenamiento, pudiendo usarla cualquier aplicación de manera independiente y ofreciendo una mejora en el tratamiento de la información y una evolución para el desarrollo de aplicaciones.

Base de datos: Es una colección de datos relacionados lógicamente entre sí, con una definición y descripción comunes y que están estructurados de una determinada manera. Es un conjunto estructurado de datos que representa entidades y sus interrelaciones, almacenados con la mínima redundancia y posibilitando el acceso a ellos eficientemente por parte de varias aplicaciones y usuarios. También almacenan una descripción de dichos datos denominada metadatos que se almacenan en el diccionario de datos o catálogo.

Una base de datos constara de:

Entidades: objeto real o abstracto con características diferenciadas de otros. Por ejemplo en una clínica veterinaria las posibles entidades pueden ser: doctor, consulta,…
Atributos: son los datos que se almacenan en la entidad. Por ejemplo raza, color, nombre,…
Registros: donde se almacena la información de cada entidad.
Campos: donde se almacenan los atributos de cada registro.

Existen cuatro tipos de personas que pueden hacer uso de una base de datos:

El administrador: persona encargada de la creación.
Los diseñadores: personas encargadas de diseñar cómo será la base de datos.
Los programadores de aplicaciones: se encargan de implementar los programas de aplicación que servirán a los usuarios finales. Estos programas son los que ofrecerán la posibilidad de realizar consultas de datos, actualización o eliminación de los datos.
Los usuarios finales: Son los clientes finales de la base de datos.

Los sistemas de almacenamiento más utilizados son:

Discos SATA
Discos SCSI
RAID
Sistemas NAS: sistema de almacenamiento masivo en la red
Sistemas SAN: Red concebida para conectar servidores, arrays de discos y librerías de soporte

Modelos de bases de datos:

Modelo jerárquico: utiliza una estructura de árbol invertido para la organización de los datos. La información se organiza de una jerarquía en la que la relación entre las entidades de este modelo siempre es del tipo padre/hijo. Existen nodos que contienen atributos o campos y que se relacionaran con sus nodos hijos, pudiendo tener cada nodo más de un hijo, pero un nodo siempre tendrá un solo padre. Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos. Los segmentos se relacionan entre si utilizando arcos.
Modelo en red: organiza la información en registros y enlaces. En los registros se almacenan los datos y los enlaces permiten relacionar estos datos. En estas bases de datos puede haber más de un padre.
Modelo relacional: utiliza tabla bidimensionales (relaciones). Cada relación posee un nombre que es único y contiene un conjunto de columnas. Cada fila de la tabla se llamará registro, entidad o tupla y cada columna de la tabla será llamada campo o atributo. A los conjuntos de valores que puede tomar un determinado atributo se le denomina dominio. Una clave será un atributo o conjunto de atributos que identifique de forma única a un registro. Las tablas deben cumplir una serie de requisitos:

Todos los registros son del mismo tipo.
La tabla sólo puede tener un tipo de registro.
No existen campos o atributos repetidos.
No existen registros duplicados.
No existe orden en el almacenamiento de los registros.
Cada registro o tupla es identificada por una clave que puede estar formada por uno o varios campos o atributos.

Modelo orientado a objetos: define una base de datos en términos de objetos, sus propiedades y sus operaciones. Los objetos con la misma estructura y comportamiento pertenecen a una clase, y las clases se organizan en jerarquías. Los conceptos más importantes de este modelo son:

Encapsulación: permite ocultar la información al resto de los objetos
Herencia: los objetos heredan comportamiento dentro de una jerarquía de clases
Polimorfismo: propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.

Modelo NoSQL: son sistemas de almacenamiento de información que no cumple con el esquema entidad-relación. Tampoco utilizan una estructura de datos en forma de tabla donde se van almacenando los datos sino que para el almacenamiento hacen uso de otros formatos como clave-valor. Las principales ventajas son:

Se pueden ejecutar en máquinas con pocos recursos
Pueden manejar gran cantidad de datos
Se añaden más nodos para mejorar el rendimiento
No genera cuellos de botella

Las principales diferencias con los sistemas SQL no:

No utilizan SQL como lenguaje de consultas
No utilizan estructuras fijas
No suelen permitir operación JOIN
La información puede estar compartida en varias máquinas mediante mecanismos de tablas Hash

Dependiente de la forma que almacena la información podemos encontrar varios tipos:

Bases de datos clave-valor: cada elemento está identificado por una llave única
Bases de datos documentales: almacena la información como un documento
Bases de datos en grafo: la información se representa como nodos de un grafo y sus relaciones son las aristas del mismo.

Modelo objeto-relacional: hibrido entre las bases del modelo relacional y del modelo orientado a objetos
Modelo de bases de datos deductivas: almacenan la información y permiten realizar deducciones a través de inferencias. Se derivan nuevas informaciones a partir de las que se han introducido explícitamente en la base de datos por parte del usuario.
Bases de datos multidimensionales: almacena sus datos con varias dimensiones, en vez de un valor encontramos varios dependiendo de los ejes definidos.
Bases de datos transaccionales: caracterizadas por su velocidad para gestionar el intercambio de información.

Diferentes clasificaciones de las bases de datos:

Bases de datos según su contenido

Bases de datos con información actual
Directorios
Bases de datos documentales

Bases de datos según su uso:

Base de datos individual
Base de datos compartida
Base de datos de acceso publico
Base de datos propietarios o bancos de datos

Bases de datos según la variabilidad de la información

Bases de datos estáticas
Bases de datos dinámicas

Bases de datos según la localización de la información

Bases de datos centralizadas
Basada en anfitrión
Basada en cliente/Servidor
Bases de datos distribuidas

Bases de datos según el organismo productor

Bases de datos de organismos públicos y de la administración
Bases de datos de instituciones sin ánimo de lucro
Bases de datos de entidades privadas o comerciales
Bases de datos de uso interno
Bases de datos de datos comerciales
Bases de datos realizadas por cooperación en red

Bases de datos según el modo de acceso:

Bases de datos de acceso local:
Bases de datos en CD-ROM
Bases de datos en línea
Acceso vía web

Bases de datos según cobertura temática

Bases de datos científico-tecnológicas
Bases de datos económico-empresariales
Bases de datos de medios de comunicación
Bases de datos del ámbito político-administrativo y jurídico
Bases de datos del ámbito sanitario
Bases de datos para el gran publico

Sistemas gestores de bases de datos: conjunto coordenado de programas, procedimientos, lenguajes, etc, que suministra los medios necesarios para describir y manipular los datos contenidos en la base de datos, manteniendo su integridad, confidencialidad y seguridad.

...

Descargar como (para miembros actualizados) txt (27 Kb) pdf (96 Kb) docx (225 Kb)

Leer 17 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com