BLAST
kikepenataSíntesis14 de Septiembre de 2014
632 Palabras (3 Páginas)737 Visitas
BLAST
PRESENTADO POR:
PRESENTADO A:
Trabajo de Bioinformática
FACULTAD DE CIENCIAS BÁSICAS
UNIVERSIDAD DE CORDOBA
2014
1. El “hombre de hielo” (iceman) es un espécimen que vivió hace 5300 años y cuyo cuerpo se recuperó de los Alpes italianos. Cierto material fúngico se recuperó de sus ropas, y fue secuenciado. ¿A qué moderno hongo se parece más el ADN de dicho material fúngico?
Al hacer la búsqueda en BLAST, qué significado tienen los descriptores:
a) Max score
b) Total score
c) Query cover
d) E value
e) Ident
f) Accesion
R/. Según la consulta se encontró que las secuencias fúngicas modernas que se parecen al ADN encontrado en las ropas del iceman son: Mrakia frigida, psychrophilia Mrakia y Cryptococcus aquaticus (cada uno con 114/117 nucleótidos de identidad y esperan que el valor de 1e-51).
a). Max score: más alta puntuación de alineación (bit-score) entre la secuencia de la consulta y el segmento de la secuencia de bases de datos.
b). Total score: suma de puntuaciones de la alineación de todos los segmentos de la misma secuencia de bases de datos que coinciden con el quary
secuencia (calculado sobre todos los segmentos). Esta puntuación es diferente de la puntuación máxima si varias partes de la base de datos
secuencian de partido diferentes partes de la secuencia de consulta
c). Query cover: por ciento de la longitud de la consulta que se incluye en los segmentos alineados. Esta cobertura se calcula
en todos los segmentos (puntuación total cf).
d). E value: Es el número de alineaciones distintas, con una puntuación igual o mejor que el S, que se espera que ocurra en una búsqueda de base de datos por casualidad. Cuanto menor sea el valor de E, la más significativa es la puntuación.
e) Ident: Se trata del porcentaje de identidad que posee la secuencia que hemos introducido y la secuencia de la base de datos, dentro de la longitud que ha encontrado.
f) Accesion: Cada entrada en estas bases de datos es un registro que debe tener un identificador único, formado por letras y/o números, que se denomina "número de acceso"
2. ¿La proteína pol de HIV 1 está más relacionada con la proteína pol de HIV 2 o con la proteína pol del virus de inmunodeficiencia de simios (SIV)?
R/. La proteína pol del virus de inmunodeficiencia de simios SIV es 79% de identidad con la pol de HIV 1. La proteína pol de HIV 2 comparte una identidad de aminoácidos sólo 55%. Por lo tanto la proteína pol de VIH-1 pol es claramente más estrechamente relacionado con su homólogo SIV que a VIH-2 pol.
3. Realice una búsqueda BLASTp en el NCBI empleando la siguiente secuencia de búsqueda: PNLHGLFGRKTG
Por defecto los parámetros se van a reajustar para búsquedas de secuencias cortas.
Inspeccione el resumen de la búsqueda ¿Cuál es el umbral para el E-value? ¿Cuál es el tamaño de la palabra? ¿Cuál es la matriz de puntuación?
R/- Tamaño de la palabra= 12
є - value= 6e – 05
4. Las búsquedas por proteínas generalmente dan más información que las de nucleótidos. Realice una búsqueda BLASTp para RBP4 (NP_006735), restringiendo la búsqueda a “arthropods”.
Luego haga la misma búsqueda para nucleótidos con BLASTn (NM_006744, seleccione solo los nucleótidos correspondientes a la región codificante) ¿qué búsqueda ofrece más información? ¿Cuántas coincidencias tienen un E--‐value menor que 1.0? ¿Qué
...