PROGRAMA DE INGENIERÍA DE BIOPROCESOS Genética y Bioinformática Prácticas
234255Apuntes22 de Agosto de 2017
2.530 Palabras (11 Páginas)327 Visitas
[pic 1]
[pic 2]
UNIVERSIDAD AUTÓNOMA DE SAN LUIS POTOSÍ
FACULTAD DE CIENCIAS QUÍMICAS
PROGRAMA DE INGENIERÍA DE BIOPROCESOS
Genética y Bioinformática
Prácticas
[pic 3]
PRÁCTICA 1. Bases de datos en biología molecular
Objetivo:
- Conocer las principales bases de datos de secuencias biológicas
- Explorar el sitio Web de inicio de los principales centros de información biológica almacenada en Internet: el NCBI, EBI y el DDBJ
Ejercicios:
- Ingrese a la página principal del NCBI: http://www.ncbi.nlm.nih.gov.
En el menú desplegable seleccionar la opción “Nucleotide” e ingrese: 1293613
¿A qué gen corresponde este número de acceso? U49845
- 3 genes
- ¿Cuál es el número de identificación de la proteína?
- ¿De qué longitud es la secuencia? ¿Está completa? 5028 solo 1 completo
- ¿A qué organismo pertenece?
Saccharomyces cerevisiae
- ¿De qué longitud es el espaciador intergénico?
Esta donde termina el primero y empieza el segundo
- Ingrese como término de búsqueda el nombre:TCP1-beta
- ¿En cuántas plantas se ha reportado este gen?
325 plantas
- ¿Cuantos genes se han reportado en maíz?
6 genes
- ¿Cuántos transcritos se han reportado?
140
- Ingrese en el menú desplegable el GI 31652304 y seleccionar la opción “Protein”.
- ¿De qué tamaño es la proteína?
- ¿En qué organismo esta reportado?
- Ingrese a la página del EBI: http://www.ebi.ac.uk/ e ingrese el número de acceso P60174.
Seleccione la secuencia de proteína correspondiente.
- ¿A que corresponde el registro?
aminoacidos
- ¿En qué organismo fue identificada la proteína?
Humano
- ¿En qué vía metabólica está involucrada esta proteína?
Gluconeogénesis
- ¿Cuál es el peso molecular de la proteína?
30 Da
- ingrese el número de acceso DQ017382 y seleccione la secuencia de nucleótidos correspondiente.
- ¿Qué tipo de molécula está registrada?
RNA
- ¿Cuál es la longitud de la secuencia?
8942 pares de bases
- ¿De qué organismo se obtuvo?
VIH
- ¿Cuántos genes se encuentran codificados en esta secuencia?
9cds splaising alternativo
- Ir a la pestaña: Other Feature(s)
- Ingrese al Banco de Datos de ADN del Japón (DDBJ): http://www.ddbj.nig.ac.jp/. Search Analysis –getentry. Ingrese el número de acceso AB026488
- ¿A qué proteína corresponde el registro?
- ¿De qué longitud es la secuencia?
- Localice el número de acceso del gen de una mioglobina de pescado
- Localice la proteína AraC de Myxococcus xanthus
TAREA 1. Bases de datos en biología molecular
Ejercicios: Resuelva los siguientes ejercicios usando la base de datos de su elección.
- Ingrese el número de acceso P60174.
- ¿A qué proteína corresponde?
Triosephosphate isomerase
- ¿Qué reacción cataliza?
D-glyceraldehyde 3-phosphate = glycerone phosphate.
- Ingrese al registro correspondiente al número de acceso P70753.
- ¿De qué proteína se trata?
Beta-galactosidase
- ¿De qué longitud es?
1005 aa
- Examine el registro con GI 995674.
- ¿Qué tipo de molécula se secuenció?
Gen (intron)
- ¿Cuál es su origen?
- ¿Codifica para alguna proteína?
No
- Encuentre el número de acceso de una proteína lipocaina (lipocalin). ¿Cuál es la función de esta proteína?
WP_053581231.1
- ¿Cuantas secuencias correspondientes a genes que codifican para la nitrato reductasa (nitrate reductase) hay descritas en plantas y cuantas en Arabidopsis thaliana?
PRÁCTICA 2. Alineamiento de secuencias (BLAST)
Objetivo:
- Conocer la utilidad y los diferentes tipos de alineamientos que existen, así como conocer las medidas de similitud entre ambas (“e-value” y el Score).
- Conocer las dos herramientas de alineamiento más usadas en bioinformática
Ejercicios:
1. Ingresar a la página http://www.ebi.ac.uk/. Dentro de la opción de “services” ingresar a “DNA & RNA”. Buscar la opción “Emboss Tools”. Realizar un alineamiento global usando la opción “Needle” protein. Introduzca las secuencias en los campos de entrada (Ejercicio 1).
- ¿Cuál es el % de identidad entre ambas secuencias?
- ¿Cuál es el % de similitud entre ambas secuencias?
- Registre el Score y la penalidad por gaps
- Comparar los resultados obtenidos en el NCBI—BLAST—Needleman-Wunsch Global Sequence Alignment Tool
SECUENCIAS PARA EJERCICIO 1
>CYB_HUMAN ID CYB_HUMAN STANDARD; PRT; 380 AA.
MTPMRKINPLMKLINHSFIDLPTPSNISAWWNFGSLLGACLILQITTGLFLAMHYSPDAS
TAFSSIAHITRDVNYGWIIRYLHANGASMFFICLFLHIGRGLYYGSFLYSETWNIGIILL
LATMATAFMGYVLPWGQMSFWGATVITNLLSAIPYIGTDLVQWIWGGYSVDSPTLTRFFT
FHFILPFIIAALATLHLLFLHETGSNNPLGITSHSDKITFHPYYTIKDALGLLLFLLSLM
TLTLFSPDLLGDPDNYTLANPLNTPPHIKPEWYFLFAYTILRSVPNKLGGVLALLLSILI
LAMIPILHMSKQQSMMFRPLSQSLYWLLAADLLILTWIGGQPVSYPFTIIGQVASVLYFT
TILILMPTISLIENKMLKWA
>CYB_DROME ID CYB_DROME STANDARD; PRT; 378 AA.
MNKPLRNSHPLFKIANNALVDLPAPINISSWWNFGSLLGLCLIIQILTGLFLAMHYTADI
NLAFYSVNHICRDVNYGWLLRTLHANGASFFFICIYLHVGRGIYYGSYKFTPTWLIGVII
LFLVMGTAFMGYVLPWGQMSFWVATVITNLLYAIPYLGMDLVQWLWGGFAVDNATLTRFF
TFHFILPFIVLAMTMIHLLFLHQTGSNNPIGLNSNIDKIPFHPYFTFKDIVGFIVMIFIL
ISLVLISPNLLGDPDNFIPATPLVTPAHIQPEWYFLFAYAILRSIPNKLGGVIALVLSIA
ILMILPFYNLSKFRGIQFYPINQVMFWSMLVTVILLTWIGARPVEEPYVLIGQILTVVYFLYYLVNPLITKWWDNLLN
2. Las secuencias del ejercicio 2 corresponden a una región de un mRNA y la otra de la región de DNA correspondiente, realizando un alineamiento global (NCBI o EBI), conteste lo siguiente:
- ¿Cuántos intrones hay?
- ¿Cuál es la longitud en pares de bases del primer intrón?
SECUENCIAS PARA EJERCICIO 2
>ref|NT_033778.2|:12293228-12293796 Drosophila melanogaster chromosome 2R
ATGGAACAGGCGTACAGTACAGCTTCCCGACTGCGTGGGATTTGCGTTTGTGGATTGGCCATTTCGGTGT
ATTCACTGTATGTGAAAATGAAACTAAAGGAGGATGAGAACTATAGGCCAATGTGCGACGTTAACGATAA
TATAAGCTGCTCGCTGGTTTTTAAATCGGGGTAGGTAAGATTATAATATATACAATATAAATTTAATGAA
ATAATTTTCCATCAGCTATGGTGATGGCTTTGGTCTGGGTAACATAACCCAAGTAAATGCTCCCAACGGA
GCCATCGGCTGTGCATTTTATATCCTGTACTTCTTGAGCTGTACGTAAATTTCTTAGTACAAACTAAACT
AAATTTAATAAGCATTTGTTTTCAGCTTTCTTTAATCATCGTTGGCTGTGCCTGGTCCAATTGATAGTAT
GCACTTTGACATTACTTCTCTGCGTTTATCTGGGTTTCCTGCTGATTCTCGTGTTTTACGATTTCTGTTT
GGTATGCGTGACCATCTATTTCATACACACATGGCTCTTTCAGGAAGTCCTAAGGCGATATAGACGCCTT
TATATGTAA
>gi|62471730|ref|NM_001014533.1| Drosophila melanogaster Vitamin-K epoxide reductase CG33544-PA (Vkor) mRNA, complete cds
ATGGAACAGGCGTACAGTACAGCTTCCCGACTGCGTGGGATTTGCGTTTGTGGATTGGCCATTTCGGTGT
ATTCACTGTATGTGAAAATGAAACTAAAGGAGGATGAGAACTATAGGCCAATGTGCGACGTTAACGATAA
TATAAGCTGCTCGCTGGTTTTTAAATCGGGCTATGGTGATGGCTTTGGTCTGGGTAACATAACCCAAGTA
AATGCTCCCAACGGAGCCATCGGCTGTGCATTTTATATCCTGTACTTCTTGAGCTCTTTCTTTAATCATC
...