Guía de Estudio Modelado de Base de Datos
rofelia009Resumen21 de Julio de 2016
4.445 Palabras (18 Páginas)272 Visitas
Guía de Estudio
Modelado de Base de Datos
Tema 1
1.- Es el almacenamiento donde residen los datos
Base de datos
2.- el sistema puede almacenar los datos mediante el uso de archivos secuenciales, indexación, dispersión, cadenas de apuntadores, compresión,
Nivel Físico
3.- en los sistemas relacionales, se requiere que la base de datos sea percibida por el usuario en forma de tablas
Nivel Lógico
4.- El proceso de manipular la información es llevado a cabo por
SMBD
5.- implica especificar los tipos de datos, estructuras y restricciones de los datos, que se almacenarán en la base de datos
Definir la base de datos
6.- La definición o información descriptiva de una base de datos también se almacena, en forma de:
Catálogo o diccionario de base de datos = metadatos
7.- incluye los medios de almacenamiento en los que el CPU (unidad central de procesamiento) puede operar, como la memoria principal del computador y las memorias caché (más pequeñas, pero más rápidas). El almacenamiento principal normalmente proporciona un acceso rápido a los datos, pero tiene una capacidad de almacenamiento limitada.
Almacenamiento principal o primario
8.- esta categoría incluye los discos magnéticos, los discos ópticos y las cintas. Las unidades de disco duro se clasifican como almacenamiento secundario, mientras que los medios removibles o extraíbles están considerados como almacenamiento terciario. Estos dispositivos normalmente tienen gran capacidad, cuestan poco y proporcionan un acceso más lento a los datos, que los dispositivos de almacenamiento principales. El CPU no puede procesar directamente los datos almacenados en un almacenamiento secundario o terciario; primero deben copiarse en el almacenamiento principal.
Almacenamiento secundario y terciario
9.- Hace referencia a una colección de relaciones, en donde cada relación asemeja a una tabla:
Representación en el modelo relacional
10.- una fila se denomina
Tupla
11.- un encabezado de columna
Atributo
12.- el nombre de la tabla
Relación
13.- No pueden tener tuplas duplicadas, es decir, las restricciones derivadas de las condiciones propias del modelo.
Las restricciones inherentes
14.- Incluyen las restricciones de dominio, las de clave, las restricciones en valores NULL, las de integridad de entidad y las de integridad referencial.
Las restricciones explicitas
15.- Restricciones que pueden expresarse directamente en los esquemas del modelo de datos, por lo general se especifican en el lenguaje de definición de datos.
Las restricciones explicitas
16.- tipos de restricciones explícitas
- Restricciones de dominio: conjunto de valores atómicos o indivisibles, en el que se indica el tipo de dato, bajo un nombre que ayude a su interpretación.
- Restricciones de clave: una relación está definida como un conjunto de tuplas. Por definición, todos los elementos de un conjunto son distintos; por tanto, todas las tuplas en una relación también deben serlo. Esto significa que dos tuplas no pueden tener la misma combinación de valores, para todos sus atributos.
- Restricciones en valores NULL: restricción en los atributos, en donde se especifica si se permiten o no los valores NULL.
17.- Restricciones que no pueden expresarse directamente en los esquemas del modelo de datos y que, por consiguiente, deben ser expresadas e implementadas por los programas. Se llaman también:
Las restricciones semánticas, basadas en aplicación o reglas de negocio.
Tema 2
18.- Define un conjunto de operaciones del modelo relacional, los cálculos relacionales ofrecen una notación declarativa de alto nivel, para especificar las consultas relacionales.
Algebra
19.- Surgen tres lenguajes formales de consulta:
- El álgebra relacional forma la base del lenguaje de consulta SQL.
- El cálculo relacional de tuplas.
- El cálculo relacional de dominios son lenguajes declarativos de consulta basados en la lógica matemática.
20.- Es como una colección de conceptos, que se pueden utilizar para describir la estructura de una base de datos.
Modelo de Datos
21.- Se refiere a los tipos de datos, relaciones y restricciones, que deben mantenerse para los datos,
Estructura de una base de datos
22.- Es un campo o una combinación de ellos, para identificar de forma única a cada fila de la tabla.
La clave primaria (Primary Key -PK-)
23.- identifica una columna o un conjunto de ellas, en una tabla (también definida como tabla hija), que hace referencia a una columna o conjunto de ellas en otra tabla (tabla maestra o tabla referenciada).
La clave foránea (Foreign key -FK-)
24.- permite realizar consultas a una base de datos relacional, de manera formal, es decir, aplica algunos conceptos matemáticos para realizar operaciones relacionales unarias y operaciones de álgebra relacional de la teoría de conjuntos.
Algebra relacional
25.- Es una relación de dependencia entre uno o más atributos, que permite crear mecanismos para evitar la redundancia (problemas de integridad) y mejorar la eficiencia.
Una dependencia funcional
26.- Tiene como objetivo transformar tablas complejas en tablas simples. El principal objetivo de este proceso es evitar la redundancia de los datos, mejorando el diseño del sistema y garantizando el cumplimiento de los requisitos del usuario.
Proceso de Normalización
27.- Una relación se encuentra en primera forma normal solo si sus atributos son atómicos, es decir, no se pueden descomponer en más atributos. El objetivo de la 1FN es hallar aquellos los atributos que tienen dependencia funcional directamente con la llave foránea (PK).
Primera Forma Normal (1FN)
[pic 1]
28.- Una relación estará en 2FN solo si está en 1FN y, además, los atributos no primos tienen dependencia funcional completa con respecto a la clave concatenada o compuesta.
Segunda Forma Normal (2FN)
[pic 2]
29.- Una relación estará en 3FN solo si está en 2FN y, además, existen atributos no claves que dependen de otros atributos no claves de la entidad compleja. Estos atributos no claves tienen relación transitiva con la entidad principal.
Tercera Forma Normal (3FN)
[pic 3]
30.- una relación está en 4FN solo si se encuentra en 3FN y no existen dependencias multivaluadas, en alguno de los atributos no claves. Un atributo multivaluadas es aquel que tiene varios posibles valores, para una sola instancia de la entidad.
Cuarta Forma Normal (4FN)
[pic 4]
31.- Esta forma normal sirve para eliminar dependencias de proyección o reunión, que raramente se encuentran en las bases de datos cotidianas.
Quinta Forma Normal (5FN)
Tema 3
32.- Consiste en actualizar, completar y mejorar toda la información que contiene la base de datos, de manera que sea fiable y apta para el fin que se creó
Calidad de Datos
33.- Define una fila como entidad única, para una tabla determinada. Exige la integridad de las columnas de los identificadores o la clave principal de una tabla.
Integridad de entidad
34.- Validez de las entradas para una columna determinada. Puede exigir la integridad de dominio, para restringir el tipo mediante tipos de datos.
Integridad de dominio
35.- Protege las relaciones definidas entre las tablas, cuando se crean o se eliminan filas. Garantiza que los valores de clave sean coherentes en las distintas tablas, que no haya referencias a valores inexistentes y que, si cambia el valor de una clave, todas las referencias a ella se cambien en consecuencia en toda la base de datos.
Integridad referencial
36.- Permite definir reglas de empresa específicas, que no pertenecen a ninguna otra categoría de integridad.
Integridad definida por el usuario
37.- Para tratar de evitar o en su defecto disminuir la problemática asociada a la falta de la calidad en los datos, es necesario llevar a cabo diversas acciones, como asegurarse de la calidad en las aplicaciones, en el sistema de base de datos y en el diseño del modelo mismo:
- Exigir la integridad de datos.
- Control de concurrencia en el acceso y modificación de los datos.
- Desarrollo de aplicaciones escalables.
- División del trabajo en posibles estados, por los que puede pasar la información. Establecer un control de flujo, evitando pasar a la siguiente fase hasta que no termina la anterior, asegurando que no se deja ningún paso sin hacer.
- Control total de usuarios que tienen acceso a la aplicación, y control estricto de los perfiles a los que pertenecen. Los usuarios estarán dentro de un perfil concreto, que les proporcionará acceso solo a determinadas funciones o datos.
- Realizar auditorías de control de cambios, que permitan conocer en cualquier momento todos los estados por los que ha pasado la información auditada, valor anterior y nuevo, usuario que realizó los cambios, fecha, validación usada para el cambio producido, etc.
- Llevar un control de cambios de los valores posibles de los datos, no permitiendo introducir incoherencias en la información.
- Llevar un control de campos que pueden ser modificados para cada regla de validación, evitando errores accidentales sobre campos correctos.
38.- herramientas que existen para la calidad de datos:
- DQS (Data Quality Services, 2012) lleva a cabo diversas actividades de calidad de datos, como las correcciones, el enriquecimiento, la estandarización y la eliminación de datos duplicados.
- Oracle Enterprise Data Quality
- Oracle Warehouse Builder
- Data profiling (SQL SERVER 2008)
Tema 4
...