Como se distribuyen las filas en La Base de Datos Teradata?

maumartSíntesis6 de Septiembre de 2018

631 Palabras (3 Páginas)118 Visitas

Página 1 de 3

Como se distribuyen las filas en

La Base de Datos Teradata?

La base de datos Teradata utiliza un Algoritmo Hash para distribuir aleatoriamente filas de la tabla a través de los AMP.

La elección del Primary Index determina si las filas de una tabla de manera uniforme o desigual distribución en el AMP.

Para trabajos de carga se distribuye uniformemente las filas.

Cada AMP es responsable de su subconjunto de las filas de cada tabla.

Las filas no se colocan en un orden particular.

Los beneficios de las filas desordenadas incluyen:

No necesita mantenimiento para preservar el orden.

El orden es independiente de cualquier consulta que se envía.

Los beneficios de la distribución de Hash son:

La distribución es la misma independientemente del volumen de datos.

La distribución se basa en el contenido de la fila, no la demografía de datos.

Primary Key (PK) vs. Primary Index (PI)

El PK es una convención de modelos de relación que identifica de forma única cada fila.

El PI es una convención de Teradata, que determina la distribución y el acceso a la fila.

Una base de datos bien diseñada tiene tablas en el PI es el mismo que el PK, así como las tablas donde se define la PI en diferentes columnas de la PK.

Rendimiento de un Join y un caminos conocidos de acceso podría dictar un PI que es diferente de la PK.

Primary Key (PK)

Concepto lógico de modelado de datos

Teradata no necesita el PK definido

No hay límite en el número de columnas

Documentado en el modelo de datos lógico

Valor debe tener un valor único

Identifica de forma única cada fila

El valor no debe cambiar

No puede ser NULL

No implica la ruta de acceso

Elegido por la corrección lógica

Primary Index (PI)

Mecanismo para la distribución de filas y el acceso.

Una tabla debe tener un Primary Index

Puede ser de 1 as 64 columnas

Definido en la sentencia CREATE TABLE

Puede tener un valor único o NO único.

Se utiliza para colocar una fila en un AMP

El valor puede ser cambiado (Updated)

Puede ser NULL

Define la más eficiente ruta de acceso

Elegido para el rendimiento físico..

Utilitario batch para cargas de una sola Tabla vacía.

A menudo se utiliza para "batch frecuente" o "mini-lotes", donde se cargan los datos a las tablas staging vacías, en estos casos se usa INSERT-SELECT para poblar las tablas.

Capacidad de Checkponit/Restar automático.

Errores notificados y recogidos en las tablas de error

Soporta las rutinas INMOD y Módulos de Acceso

Las cargas de datos en dos fases

Carga/Mantiene hasta cinco tablas pobladas o vacías.

Realiza operaciones a nivel de bloque en contra de las tablas de destino

Bloques de datos afectados se escriben una vez

Operaciones múltiples con un solo paso de archivos de entrada

Usa lógica condicional para aplicar Updates.

Compatible con INSERT, UPDATE, DELETE y upsert operaciones

Soporta las rutinas INMOD y Módulos de Acceso

Errores notificados y recogidos en las tablas de error

Proporciona capacidad automático Checkpoint / Restart

Cargas estándar de proceso por lotes de grandes cantidades de datos de manera eficiente

Exporta grandes volúmenes de datos formateados desde una o mas tablas en la base de datos Teradata a un archivo de salida.

Soporta múltiple sesiones

Exporta desde múltiples tablas

Provee checkpoint/restart Automático.

Permite casi en tiempo real las actualizaciones de los sistemas transaccionales en el

...

Descargar como (para miembros actualizados) txt (4 Kb) pdf (44 Kb) docx (13 Kb)

Leer 2 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com