ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Matrices En Las Ciencias Genómicas.


Enviado por   •  1 de Marzo de 2014  •  1.105 Palabras (5 Páginas)  •  217 Visitas

Página 1 de 5

Matrices en las Ciencias genómicas.

Base de datos biológica (secuenciales de organismos):

Uno de los tipos de bases de datos más usuales en bioinformática, son las bases de datos de secuencias. Estas son una gran colección de secuencias de ADN, proteínas y otras, que son almacenadas en computadoras. Una base de datos puede incluir secuencias de un sólo organismo, como la base de datos que contiene todas las proteínas de la Saccharomyces cerevisiae, o puede incluir secuencias de todos los organismo cuyo ADN ha sido secuenciado.

Comparación de Aminoácidos (contenido):

Antes que nada, habrá que definir lo que es un aminoácido:

Un aminoácido, es una proteína la cual, su plan de construcción es similar a la parafina o polímeros sintéticos, que consisten en largas cadenas de unidades o monómeros, que en las proteínas se llaman aminoácidos. Como su nombre indica, es una molécula orgánica con un grupo amino (-NH2) y un grupo carboxílico (-COOH; ácido). Existen veinte clases de aminoácidos en las proteínas, ofreciéndonos veinte clases diferentes de cadena lateral que sobresalen de la cadena principal de la molécula. Dos aminoácidos se combinan en una reacción de condensación que libera agua formando un enlace peptídico. Estos dos "residuos" aminoacídicos forman un di péptido. Si se une un tercer aminoácido se forma un tri péptido y así, sucesivamente, para formar un poli péptido. Esta reacción ocurre de manera natural en los ribosomas, tanto los que están libres en el citosol como los asociados al retículo endoplasmático.

Los aminoácidos tienen una manera específica y, si no estás familiarizado con esto, algo raro, de comparación de contenido en los aminoácidos.

Las matrices BLOSUM que significa (Blocks of Amino Acid Substitution Matrix, o matriz de sustitución de bloques de aminoácidos) son matrices de sustitución utilizadas para el alineamiento de secuencias de proteínas. BLOSUM se usa para puntuar alineamientos entre secuencias de proteínas evolutivamente divergentes. Se basa en alineamientos locales, recorrieron la base de datos BLOCKS analizando regiones muy conservadas de familias de proteínas (sin huecos en el alineamiento de secuencias) y comprobaron las frecuencias relativas de aparición de los aminoácidos y las probabilidades de sustitución entre ellos. Seguidamente calcularon una puntuación de log-probabilidad para cada una de las 210 posibles sustituciones de los 20 aminoácidos estándar. Todas las BLOSUM se basan en alineamientos observados, y no son extrapoladas de comparaciones de proteínas cercanamente relacionadas (como es el caso de las matrices PAM, obtenidas al multiplicar por sí misma un determinado número de veces una matriz inicial).

Existen bastantes conjuntos de matrices BLOSUM que utilizan diferentes bases de datos de alineamientos, y que se nombran con números. Las BLOSUM seguidas de un número alto están diseñadas para comparar secuencias cercanamente relacionadas, mientras que las BLOSUM con número bajo están diseñadas para comparar secuencias relacionadas de forma distante. Por ejemplo, BLOSUM 80 se usa para alineamientos menos divergentes, mientras que BLOSUM 45 se usa para alineamientos más divergentes. Las puntuaciones dentro de una matriz BLOSUM corresponden a log-probabilidades que reflejan, en un alineamiento, el logaritmo de la razón de la probabilidad de la aparición de dos aminoácidos de una forma biológicamente intencionada o aceptada (residuos homólogos; este numerador es la probabilidad de la hipótesis que queremos contrastar) y la probabilidad de su aparición por casualidad (el denominador es la probabilidad de la hipótesis nula). Las matrices se basan en el mínimo porcentaje de identidad de la secuencia de proteína alineada usada al calcularlas (por ejemplo. BLOSUM 45 correspondería a alineamientos con un máximo de un 45% de identidad). A cada posible identidad o sustitución se le asigna una puntuación basada en las frecuencias observadas en el alineamiento de proteínas relacionadas. Se da una puntuación positiva a las sustituciones más probables, mientras que corresponde una puntuación negativa para sustituciones menos probables.

BLOSUM 62 es la matriz calculada usando las sustituciones observadas entre proteínas que tienen, como mínimo, el 62% de identidad en la secuencia, y se ha convertido en el estándar de la mayoría de los programas que utilizan este tipo de matrices.

BLOSUM ha demostrado

...

Descargar como (para miembros actualizados)  txt (8 Kb)  
Leer 4 páginas más »
Disponible sólo en Clubensayos.com