Cadia Marquez
usuariochiu1 de Junio de 2015
30.590 Palabras (123 Páginas)119 Visitas
los datos necesarios para la salida, estos archivos contienen caracteres especiales necesarios para controlar a la impresora. Estos caracteres especiales contienen códigos de comandos para la impresora necesarios para que dicho dispositivo realice funciones como los retornos de carro, formateo de fuentes, fabulaciones.
Ventajas y desventajas:
Ventajas:
Los archivos secuenciales proveen la mejor utilización de espacio y son rápidos cuando los registros son accesos secuencialmente.
Los archivos con poca volatilidad, gran actividad y tamaño variable son altamente susceptibles de ser organizados secuencialmente.
La ventaja más importante de la técnica de organización secuencial de archivos es la capacidad de acceso al "siguiente" registro rápidamente: Mientras que el patrón de acceso a un archivo secuencial se conforme al ordenamiento de registros en el archivo, los tiempos de acceso serán muy buenos. Sin embargo, si el patrón de acceso al programa no se conforma al patrón de ordenamiento de los registros, entonces la eficiencia del programa puede ser terrible.
Otra ventaja de los archivos de organización secuencial es que son muy sencillos de usar y aplicar.
Desventajas:
El acceso a un registro es pobre, la localización de un determinado registro no se puede hacer individualmente no de manera rápida, y el acceso aleatorio es impráctico.
Además, en los archivos secuenciales la dirección de registro está implícita y están vulnerables a fallas del sistema.
En clases realizamos programas que nos permitieron realizar este método de búsqueda.
2.2 Organización Secuencial Indexada
Una de las organizaciones de archivos más ampliamente usada es la secuencial indexada, la cual es posible el acceso a un registro en particular (aleatoria) y el proceso secuencial a partir del inicio del archivo en cualquier otro registro del archivo.
Cada registro en el archivo se identifica por medio de un número o un grupo de caracteres exclusivos; la llave primaria.
Los registros se almacenan según una secuencia física dada, este ordenamiento más usualmente es de disponerlos en el orden indicado por la llave, con lo cual permite un procesamiento secuencial de los registros precisamente en el orden en que están distribuidos en el archivo y también es posible el procesamiento aleatoria, en el que se llega a los registro en un orden cualquiera.
El índice puede definirse como una entidad que opera con un procedimiento que acepta información acerca de cierto valor de atributo, como entrada, y provee como salida una información que permite la rápida localización del registro de le llama primario al índice que utiliza como entrada la llave primaria y da como salida una información referente a la ubicación física del registro.
Para que la búsqueda sea más eficiente y reducir el tamaño del archivo índice, los campos referentes a la información asociada se almacenan separadamente, con los cual se tendrá que considerar una colección ante la llave y los datos asociados, esta es a través de un apuntador.
Al tener un apuntador fuera de la estructura califica al archivo como índice, en cual básicamente es una colección de pares, llaves-dirección.
Si este archivo contiene un par llave-dirección para cada registro de la colección de datos se le llama índice denso, de otra manera índice no denso se le llama índice disperso.
Índice Datos
Una forma sencilla de ver la estructura de un archivo índice es la de un árbol de búsqueda binaria, el cual es usado para cumplir el requerimiento de acceso particular a un registro, esta es una organización no secuencial indexada
D B G A C E J 1 2 3 Datos no ordenados D 1 B 2 G 3 A 4 C 5 D 6 J 7 Llave Dirección
Ventajas:
Permite procesar el archivo secuencialmente por orden lógico y también procesarlo al azar.
La organización secuencial indexada es conveniente para archivos con mediana volatilidad, actividad variable y tamaño relativamente estable.
Desventajas:
Los índices requieren espacio extra, se necesita una doble búsqueda; una en el índice y otra en el archivo.
Los registros deben ser de longitud fija.
El archivo debe estar separado por un dispositivo de acceso aleatorio; no se puede utilizar en cintas magnéticas.
Muchas técnicas para organizar un archivo como índice han sido propuestas. No todos los esquemas sencillos pueden ser óptimos para todas las aplicaciones, se utilizan principalmente las técnicas para implementar un índice Árbol y Árbol B+.
ARBOL B
Una de las estructuras que más ampliamente se ha usado para organizar un índice en un sistema de base de datos y en administradores de archivos tradicionales es el árbol B. (B Tree).
Un árbol B es una clase especial de árbol multicamino equilibrado que permite recuperar, eliminar e insertar registros de un archivo extremo con buen rendimiento en el peor caso.
Árbol B (Orden 5) ABC EF HDK MN PQ ST VW Y7 DG ORUX L
Formalmente, un árbol de M vías es un árbol de búsqueda de orden M con las siguientes propiedades:
1.- Cada nodo del árbol, excepto la raíz y las hojas tienen al menos [ ½ * M] subárboles y no más de M subárboles.
2.- La raíz del árbol tiene al menos dos subárboles, si es que no es una hoja.
3.- Todas las hojas del árbol están al mismo nivel.
Las estructuras que se usan en el árbol B están basadas en tres tipos de nodos:
1.- Un bloque para el nodo raíz
2.- Nodos bloque para las ramas
3.- Nodos bloque para las hojas
El nodo raíz inicia la estructura del árbol. Una hoja es un nodo terminal sin hijos. El tamaño de un nodo (bloque) es usualmente elegido para reflejar algún múltiplo del tamaño del bloque del disco.
Hay varias formas de organizar las hojas, una de ellas es que el archivo principal esta almacenado solo en las hojas, y que cada hoja ocupa un bloque. También es importante hacer notar si se trata de un índice denso, en tal caso se tendrá que mantener en cada nodo la dirección de la información asociada al valor de la llave, o sise trata de in índice disperso donde se tendría ciertos valores de llaves en el índice y en las hojas existirían todos los valores de llaves que propiamente es el archivo principal.
Búsqueda Aleatoria Búsqueda Secuencial Índice como Árbol B
En un árbol B+, todas las llaves en las hojas. Los niveles superiores, los cuales están organizados como un árbol B, consisten únicamente de un índice para localizar rápidamente.
Los nodos índices y los nodos hoja pueden tener diferentes formatos o tamaños. Los nodos hoja son usualmente encadenados juntos de izquierda a derecha, ósea por el valor de la llave.
La lista de hojas es referida como el conjunto secuencia, lo cual permite un fácil procesamiento secuencial.
Para el proceso de búsqueda se realiza desde la raíz del árbol a través del índice hasta una hoja. Ya que todas las llaves residen en las hojas, no todos los valores de llaves son encontrados en la trayectoria de búsqueda, si no hasta llegar a la hoja correcta
2.3.-Organización directa
Consiste en una serie de posiciones de memoria numeradas llamadas celdas. Estas celdas son de igual capacidad, y están numerados consecutivamente de 1 a N. los registros se sitúan en el archivo de acuerdo a su número de celda. Estas celdas se convierten en registros numerados, siendo su número de posición que ocupan respecto al principio del archivo.
VENTAJAS
* Permite la consulta directa, sin lectura de los registros anteriores.
* Permite realizar operaciones de escritura y lectura simultáneamente.
* Son muy rápidos al tratar registros individuales.
INCONVENIENTES
* Deja gran cantidad de posiciones libres de memoria dentro del fichero.
* Se producen colisiones, ya que puede existir más de un registro con la misma clave.
* Al realizar un acceso secuencial, en una consulta sobre todos los registros del fichero hay que recorrer todas las direcciones que aun estén vacías.
3.1 Procesamiento de Archivo CVS
Archivos CSV Son un tipo de documento que contiene un formato sencillo para representar datos en forma de una tabla. Sus siglas en inglés: C = CommaS = Separated V = Values Una característica es:* Las columnas se encuentran separadas por comas.* Las filas por saltos de línea. Este formato es muy sencillo, un ejemplo puede ser una hoja de cálculo: A continuación se muestra otro ejemplo:1990, María, 10231416, 4to semestre1991, Mario, 10231516, 2do semestre En el caso de que se encuentren comas en el mismo texto, entonces, se utilizan las comillas dobles para citar la diferencia:"1990, María", "10231416, 4to semestre""1991, Mario", "10231516, 2do semestre "Este tipo de ficheros utilizan un formato llamado RFC 4180 el cual da formato y tipo. Introducción El formato de valores separados por comas (CSV) se ha utilizado para el intercambio de Y la conversión de datos entre diferentes programas de hoja de cálculo para bastante Algún tiempo. Sorprendentemente, mientras que este formato es muy común, se ha Nunca fue formalmente documentados. Además, mientras que la IANA MIME Registro
...