ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

BASES DE DATOS GenBank


Enviado por   •  27 de Febrero de 2018  •  Tareas  •  2.142 Palabras (9 Páginas)  •  162 Visitas

Página 1 de 9

Universidad Mariano Gálvez

Facultad de Ciencias Químicas y Biológicas

Bioinformática

Florencia Camere (1009-15-20130)

21/02/2018

BASES DE DATOS

  1. GenBank

Historia

Walter Goad del grupo de Biología teórica y biofísica del Laboratorio Nacional Los Alamos y otros, fundaron la base de datos de secuencias de Los Alamos (LANL) en 1979, que culminó en 1982 con la creación de GenBank por parte de los Institutos Nacionales de Salud (National Institutes of Health, NIH), la Fundación Nacional de Ciencia, el Departamento Energía y el de Defensa de EE. UU. LANL colaboró con GenBank gracias al trabajo de Bolt, Beranek y Newman. Hacia fines de 1983 había más de 2000 secuencias almacenadas en él.

A mediados de los '80, la compañía de bioinformática Intelligenetics de la Universidad de Standford manejó el proyecto GenBank en colaboración con LANL. El proyecto GenBank lanzó el grupo de noticias BIOSCI/Bionet que fue uno de los primeros proyectos de la comunidad bioinformática en Internet, y cuyo fin era la promoción de comunicaciones libres entre biocientíficos. Desde 1989 a 1992, el proyecto GenBank tuvo una transición hacia el recién creado Centro Nacional de Información sobre Biotecnología.

Entidad encargada

De la gestión y distribución de GenBank se encarga el NCBI (National Center for Biotechnology Information) en los Estados Unidos. Junto con el ENA (European Nucleotide Archive) y el DDBJ (DNA Data Bank of Japan) forma el consorcio INSDC (International Nucleotide Sequence Database Collaboration). Cada día, las tres BD ponen al día sus contenidos para que todas ellas dispongan de la misma información.

[pic 1]

Información

GenBank es una base de datos (BD) pública que contiene una extensa colección de secuencias de nucleótidos obtenidas a partir de más de 300.000 especies. Además de la secuencia, incluye información bibliográfica, anotaciones funcionales y, si se trata de una secuencia codificante, su traducción conceptual a proteína.

Cada registro de GenBank contiene una secuencia ininterrumpida de una molécula de polinucleótido. Podemos encontrar varios tipos de polinucleótidos: ADN genómico, ARN genómico, ARN precursor, ARNm (ADNc), ARN ribosómico, ARN de transferencia, ARN pequeño nuclear o ARN pequeño citoplasmático.

El tamaño mínimo de las secuencias almacenadas en GenBank es de 50 nucleótidos, aunque algunos registros antiguos pueden tener secuencias más cortas. No hay límite máximo, ya que se pueden mandar genomas completos (como el U00089), pero por motivos prácticos, se suele limitar el tamaño de los registros a 350 kb. Además, los registros incluyen anotaciones bibliográficas y biológicas.

Tipo de base de datos

  • PubMed: publicaciones científicas.
  • PubMed Central.
  • Nucleotide: secuencias de nucleótidos.
  • Gene, EST, UniGene, SNP.
  • Protein: secuencias de aminoácidos.
  • Structure.
  • Genome: secuencias genómicas.

Cantidad de datos almacenados

  • 191401393188 pares de bases.
  • 191.4 Gbases.  
  • 200 entradas nuevas cada día.

Uso de datos

La base de datos de GenBank está diseñada para proporcionar y fomentar el acceso dentro de la comunidad científica a la información de secuencia de ADN más actualizada y exhaustiva. Por lo tanto, NCBI no impone restricciones sobre el uso o la distribución de los datos de GenBank. Sin embargo, algunos remitentes pueden reclamar patentes, derechos de autor u otros derechos de propiedad intelectual en todo o en parte de los datos que han enviado. NCBI no está en condiciones de evaluar la validez de dichos reclamos y, por lo tanto, no puede proporcionar comentarios ni permisos sin restricciones sobre el uso, la copia o la distribución de la información contenida en GenBank.

  1. Ensembl

Historia

Ensembl es una asociación del Instituto Europeo de Bioinformación y el Instituto Sanger, establecido en 1999 después de la finalización del Proyecto del Genoma Humano. La tarea de Ensemble es proporcionar una fuente central de información para el uso de la genética, la biología molecular y otros científicos que estudian los genomas de vertebrados.

Entidad encargada

NCBI (National Center for Biotechnology Information) y USCS Genome browser.

Información

La información tal como la secuencia del gen, las variantes de corte y empalme y la anotación adicional pueden recuperarse a nivel del genoma, el gen y la proteína. Esto incluye información sobre dominios de proteínas, variación genética, homología, regiones sinténicas y elementos reguladores. Junto con análisis tales como alineaciones del genoma completo y los efectos de la variación de la secuencia sobre la proteína, esta poderosa herramienta tiene como objetivo describir un gen o región genómica en detalle.

Ensembl importa secuencias de genoma de consorcios que nos mantienen consistentes con muchos otros proyectos de bioinformática. Cada especie en Ensembl tiene su propia página de inicio, donde puede averiguar quién proporcionó la secuencia del genoma y qué versión del ensamblaje del genoma está representada.

Base de datos

  • Genoma: Ensembl.
  • Proteína: UniProtKB.
  • Nucleótido: EMBL.

Puede haber cientos de números de acceso distintos para un mismo gen. Las bases de datos son altamente redundantes.

Ensembl (EBI) trata de mantener identificadores únicos para cada gen o producto génico, independientemente del nº de secuencias asociadas.

Usos y aplicaciones

Ensembl es un navegador genómico para genomas de vertebrados que respalda la investigación en genómica comparativa, evolución, variación de secuencias y regulación transcripcional. Ensembl anota genes, calcula múltiples alineamientos, predice la función reguladora y recopila datos sobre enfermedades. Las herramientas de Ensembl incluyen BLAST, BLAT, BioMart y el Variant Effect Predictor (VEP) para todas las especies compatibles.

        

  1. OMIM

Historia

En 1960 fue creada la base de datos MIM por el Dr. Victor A. Mc.Kusick. En 1985 fue creada la base de datos OMIM (versión en línea) por la biblioteca Nacional de Medicina y la Biblioteca Médica William H. Welch en Johns Hopkins. En 1987 fue puesto en línea y en 1995 fue desarrollado para la World Wide por NCBI, el Centro Nacional de Información sobre Biotecnología Web.

...

Descargar como (para miembros actualizados)  txt (14.5 Kb)   pdf (250.4 Kb)   docx (183.6 Kb)  
Leer 8 páginas más »
Disponible sólo en Clubensayos.com