Como se distribuyen las filas en La Base de Datos Teradata?
maumartSíntesis6 de Septiembre de 2018
631 Palabras (3 Páginas)98 Visitas
Como se distribuyen las filas en
La Base de Datos Teradata?
La base de datos Teradata utiliza un Algoritmo Hash para distribuir aleatoriamente filas de la tabla a través de los AMP.
La elección del Primary Index determina si las filas de una tabla de manera uniforme o desigual distribución en el AMP.
Para trabajos de carga se distribuye uniformemente las filas.
Cada AMP es responsable de su subconjunto de las filas de cada tabla.
Las filas no se colocan en un orden particular.
Los beneficios de las filas desordenadas incluyen:
No necesita mantenimiento para preservar el orden.
El orden es independiente de cualquier consulta que se envía.
Los beneficios de la distribución de Hash son:
La distribución es la misma independientemente del volumen de datos.
La distribución se basa en el contenido de la fila, no la demografía de datos.
Primary Key (PK) vs. Primary Index (PI)
El PK es una convención de modelos de relación que identifica de forma única cada fila.
El PI es una convención de Teradata, que determina la distribución y el acceso a la fila.
Una base de datos bien diseñada tiene tablas en el PI es el mismo que el PK, así como las tablas donde se define la PI en diferentes columnas de la PK.
Rendimiento de un Join y un caminos conocidos de acceso podría dictar un PI que es diferente de la PK.
Primary Key (PK)
Concepto lógico de modelado de datos
Teradata no necesita el PK definido
No hay límite en el número de columnas
Documentado en el modelo de datos lógico
Valor debe tener un valor único
Identifica de forma única cada fila
El valor no debe cambiar
No puede ser NULL
No implica la ruta de acceso
Elegido por la corrección lógica
Primary Index (PI)
Mecanismo para la distribución de filas y el acceso.
Una tabla debe tener un Primary Index
Puede ser de 1 as 64 columnas
Definido en la sentencia CREATE TABLE
Puede tener un valor único o NO único.
Se utiliza para colocar una fila en un AMP
El valor puede ser cambiado (Updated)
Puede ser NULL
Define la más eficiente ruta de acceso
Elegido para el rendimiento físico..
Utilitario batch para cargas de una sola Tabla vacía.
A menudo se utiliza para "batch frecuente" o "mini-lotes", donde se cargan los datos a las tablas staging vacías, en estos casos se usa INSERT-SELECT para poblar las tablas.
Capacidad de Checkponit/Restar automático.
Errores notificados y recogidos en las tablas de error
Soporta las rutinas INMOD y Módulos de Acceso
Las cargas de datos en dos fases
Carga/Mantiene hasta cinco tablas pobladas o vacías.
Realiza operaciones a nivel de bloque en contra de las tablas de destino
Bloques de datos afectados se escriben una vez
Operaciones múltiples con un solo paso de archivos de entrada
Usa lógica condicional para aplicar Updates.
Compatible con INSERT, UPDATE, DELETE y upsert operaciones
Soporta las rutinas INMOD y Módulos de Acceso
Errores notificados y recogidos en las tablas de error
Proporciona capacidad automático Checkpoint / Restart
Cargas estándar de proceso por lotes de grandes cantidades de datos de manera eficiente
Exporta grandes volúmenes de datos formateados desde una o mas tablas en la base de datos Teradata a un archivo de salida.
Soporta múltiple sesiones
Exporta desde múltiples tablas
Provee checkpoint/restart Automático.
Permite casi en tiempo real las actualizaciones de los sistemas transaccionales en el
...