ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Problemas bioinformatica


Enviado por   •  14 de Mayo de 2020  •  Prácticas o problemas  •  1.290 Palabras (6 Páginas)  •  95 Visitas

Página 1 de 6

BIOINFORMATICA

Examen parcial

Fecha de asignación: 14 de abril de 2020, 3pm.  

Fecha de entrega: 24 de abril de 2020, 3pm.

Alumna: Lorna Gabriela Cuevas Douglas.                                  Matricula: 1150658

Responda las siguientes preguntas:

  1. Deduzca la complejidad (en tiempo) del siguiente algoritmo de programación dinámica. Asumir que: m es la longitud de la secuencia 1, n es la longitud de la secuencia 2, y g es un valor asignado a los gaps.

m = |secuencia 1|

n  = |secuencia 2|

for i = 0 to m do [pic 1][pic 2]

   A[i, 0] = i*g  

for j = 0 to n do [pic 3][pic 4]

  A[0, j] = j*g

for i = 1 to m do [pic 5]

 for j = 1 to n do

  A[i, j] = max{  A[i-1, j] + g; [pic 6]

     A[i-1, j-1] + score(s[i], t[j]);

 [i, j-1] + g

  }

Return A  

 Complejidad total= O(mn) lineal.

  1. Los cromosomas heredados por cada uno de los padres a sus hijos, son el producto de la recombinación de los cromosomas que los abuelos, a su vez, heredaron a los padres. Se sabe que esta recombinación se lleva a cabo en el núcleo de la célula, en parte por una maquinaria molecular formada por varias proteínas y otras sustancias. Existe la hipótesis de que esta maquinaria molecular es un mecanismo de reparación de ADN, que trabaja reconstruyendo los cromosomas al momento de que la célula va ser replicada. Una proteína que se sebe es parte de esta maquinaria de reparación de ADN es la RAD51_YEAST (ig = 131783). Se desea hacer un estudio comparativo de esta proteína en varios organismos por lo que se han detectado algunas de sus homologas, las cuales tiene los siguientes números de identificación: 118683, 3914552, 13363027 y 1350566. Resuelva las siguientes preguntas, con las herramientas que se indican:
  1. Utilice la base de datos de GenBank y descargue las 5 proteínas en formato FASTA (contenido de aminoácidos).  Responda las siguientes preguntas:
  1. ¿Cuáles son los organismos correspondientes a cada uno de estos números de Identificación?
  1. 131783: Saccharomyces cerevisiae
  2. 118683: Saccharomyces cerevisiae
  3. 3914552: Archaeoglobus fulgidus
  4. 13363027: Escherichia coli
  5. 1350566: Streptomyces violaceus
  1. ¿Cuál es la longitud en aminoácidos de cada una de estas proteínas?
  1. 131783: 400 aminoácidos.
  2. 118683: 334 aminoácidos.
  3. 3914552: 337 aminoácidos.
  4. 13363027 353 aminoácidos.
  5. 1350566: 377 aminoácidos.

  1. Utilice el programa MEGA X. Aplique el algoritmo ClustalW y genere un alineamiento de múltiple de las 5 proteínas del problema 2. Grabe el archivo con el alineamiento, preséntelo en su respuesta. Abra el alineamiento con MEGA X y conteste las siguientes preguntas:

[pic 7]

Figura 1. Proteínas alineadas.

  1. Genere una matriz de distancias (con MEGA X), utilizando la distancia simple (número de diferencias). Presente la matiz de distancias.

[pic 8]

Figura 2. Matriz de distancias creada en MEGA.

  1. Utilice el algoritmos Nieghbor-Joining (con MEGA X) y genere un árbol filogenético. Presente el árbol filogenético.

[pic 9]

Figura 3. Árbol filogenético creado en MEGA.

  1. Tome la matriz de distancias generada con MEGA X, de la pregunta 3, y aplique (a mano) el algoritmo Neighbor-Joining, y genere un árbol filogenético. Presente los cálculos junto con el árbol y responda las siguientes preguntas:

Matriz d inicial:

A

B

C

D

E

A

0

182

183

301

298

B

182

0

176

287

293

C

183

176

0

285

290

D

301

287

285

0

127

E

298

293

290

127

0

[pic 10]

Topología inicial:

[pic 11][pic 12][pic 13]

Calculo de la matriz Q:

[pic 14]

[pic 15]

[pic 16]

[pic 17]

[pic 18]

[pic 19]

[pic 20]

[pic 21]

[pic 22]

[pic 23]

[pic 24]

Matriz Q:

A

B

C

D

E

A

0

-1356

-1349

-1061

-1078

B

-1356

0

-1344

-1077

-1067

C

-1349

-1344

0

-1079

-1072

D

-1061

-1077

-1079

0

-1627

E

-1078

-1067

-1072

-1627

0

...

Descargar como (para miembros actualizados)  txt (10.2 Kb)   pdf (787.4 Kb)   docx (1 Mb)  
Leer 5 páginas más »
Disponible sólo en Clubensayos.com