ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

PROTOCOLO DE INVESTIGACION METODOS COMPUTACIONALES

gil8Apuntes18 de Febrero de 2016

5.068 Palabras (21 Páginas)344 Visitas

Página 1 de 21

PROTOCOLO DE INVESTIGACION

METODOS COMPUTACIONALES

Métodos computacionales se han desarrollado para interpretar matemáticamente ADN mezclado y bajo plantilla. El enfoque de modelado genotipo separa computacionalmente los contribuyentes a una mezcla, con la incertidumbre representada a través de la probabilidad. La comparación de los genotipos inferidos calcula un cociente de probabilidad (LR), que mide la información de identificación. Este estudio examinó estadísticamente el desempeño de modelado genotipo del sistema informático Cybergenetics TrueAllele®. Mezclas de ADN de alta y baja de la plantilla de composición aleatorizado conocido que contiene 2, 3, 4, y 5 colaboradores se pusieron a prueba. La sensibilidad, especificidad y reproducibilidad se establecieron a través de LR cuantificación en cada uno de estos ocho grupos. Análisis de covarianza encontró comportamiento LR a ser relativamente invariantes a la cantidad de ADN o número de contribuyente. El análisis de varianza reveló que se produjeron soluciones consistentes, una vez que se considera un número suficiente de contribuyentes. Este estudio demuestra la fiabilidad de la interpretación TrueAllele en mezclas de ADN complejas de composición trabajo de casos representativos. Los resultados pueden ayudar a predecir un resultado información para un análisis de mezcla de ADN.

Pruebas ácido desoxirribonucleico (ADN) es el estándar de oro forense [1]. Millones de repetición en tándem corto (STR) [2] genotipos se han ensayado para la comparación forense. Los principios de interpretación STR son más clara sobre elementos de origen vírgenes, solteras que contienen abundante ADN (por lo general alrededor de 1 ng). Un genotipo definido primero se puede inferir, a continuación, en comparación con otro genotipo definido, con el fin de calcular una estadística probabilidad de coincidencia aleatoria (RMP) con relación a un "aleatorio" genotipo población. Este es sin duda la situación cuando se compara el ADN prístina de artículos de referencia individuales.

Sin embargo, los laboratorios del crimen proceso hoy las pruebas de ADN que es mucho menos prístina. La evidencia biológica se puede mezclar (que contiene dos o más colaboradores), nivel inferior (que tiene menos de 200 pg de ADN [3]), o degradado. En algunos laboratorios forenses de ADN, la mayoría de los artículos en la evidencia son mezclas, posiblemente bajo nivel, que a menudo contienen tres o más colaboradores. Los procedimientos del manual "a base de umbral" de interpretación de datos [4], originalmente desarrolladas para muestras prístinas, no son tan eficaces en los datos de ADN mixtas [5].

Métodos de interpretación por ordenador que utilizan más de los datos de altura de pico cuantitativos STR (en lugar de umbrales) se han utilizado desde hace veinte años [6]. Básico "deconvolución mezcla" de los datos de la mezcla de ADN forense en genotipos posibles contribuyentes se realiza por otras aplicaciones de software como 'GeneMapper® ID-X y NicheVision Forense' Applied Biosystems ArmedXpert ™. Alelo métodos "deserción" cualitativos ponen una probabilidad a los datos máximos no observados, como en likeLTD de David Balding [7] y FST programas [8] software de Adele Mitchell.

El método de "modelado genotipo" va más allá y se esfuerza por conservar la información de identificación de ADN al explicar los datos observados STR en términos de la suma de los genotipos contribuyentes [9, 10]. Este método se desarrolla bayesianos ecuaciones del modelo de probabilidad que pueden explicar los datos y (cuando el espacio de la solución se vuelve inmensa) utiliza métodos estadísticos de búsqueda para resolver las ecuaciones. Tales sistemas informáticos incluyen DNAmixtures [11] y los esfuerzos relacionados [12], MixSep [13], STRmix [14], y TrueAllele® Casework [15, 16].

Sistema Cybergenetics TrueAllele Casework separa los datos de mezclas complejas en sus genotipos componentes. Para cada colaborador, en cada locus, un genotipo y su incertidumbre se describe mediante una distribución de probabilidad sobre posibilidades par de alelos. Este genotipo se resume la información de identificación de los datos e imparte a las mezclas de ADN de la simplicidad original de la interpretación de una sola fuente. Por ejemplo, la estadística partido se asemeja RMP, como inferidos genotipos se comparan uno con el otro.

Anteriores estudios de validación TrueAllele se han publicado. De dos personas mezclas de composición conocida han sido examinados por su respuesta de información, con cantidades variables de ADN molde [17] y en pequeñas cantidades utilizando interpretación conjunta [18]. Más de 150 elementos de la mezcla trabajo de casos que contienen 2, 3, o 4 contribuyentes han sido analizados para obtener información partido en una amplia gama de pesos y cantidades de mezcla, con la comparación que se hace a los métodos de revisión humanos [15, 16, 19]. Sin embargo, todavía no ha habido un estudio de mezclas conocidas con hasta cinco contribuyentes desconocidos, donde los pesos mezcla reflejaban trabajo de casos realistas en lugar de relaciones de números enteros sencillos.

Este estudio analiza las fortalezas y limitaciones de la interpretación de ADN utilizando el sistema TrueAllele Casework en mezclas de laboratorio-sintetizado de composición conocida. Las mezclas que tienen 2, 3, 4, 5 y colaboradores se ponen a prueba, con las dos cantidades altas y bajas de ADN. Un diseño de estudio aleatorio asegura simulación realista de pruebas trabajo de casos del mundo real. Información de coincidencia de ADN se utiliza en todo para evaluar los resultados de interpretación. Materiales
Diseño aleatorizado

Un estudio de validación ayuda a establecer la fiabilidad de un método, y su idoneidad para la aplicación forense. Pruebas mezcla de ADN contiene contribuciones de dos o más individuos en proporciones desconocidas aleatorios. La mayoría de los estudios de mezcla utilizan proporciones de mezcla enteros, proporcionando una simplificación conveniente para el montaje de la muestra de laboratorio. Si bien estas relaciones integrales pueden ser suficientes para la interpretación manual, modelado por computadora puede extraer más información de los datos cuantitativos. Por lo tanto, se utilizaron relaciones de mezcla aleatorios en este estudio para representar de manera más realista evidencia real trabajo de casos.

Hubo cuatro grupos de mezcla, correspondientes a 2, 3, 4, o 5 colaboradores. Dentro de cada grupo, diez mezclas se construyen a partir de cinco muestras de referencia conocidas. Los contribuyentes incluidos en cada mezcla se determinaron mediante selección aleatoria de referencias de ADN. Los pesos de la mezcla de los contribuyentes en cada elemento mezcla fueron extraídas al azar de una distribución uniforme, calculado por el muestreo de Dirichlet. Los cuatro grupos de mezcla, conteniendo cada diez artículos, produjeron un total de 40 artículos de la mezcla de ADN aleatorios (Tabla 1).
Tabla 1. Diseño del estudio. Se utilizaron cinco referencias conocidas para crear aleatoriamente diez muestras de mezcla que tiene 2, 3, 4, 5 y colaboradores. Los pesos de la mezcla se muestran

STR datos

Datos STR mezcla se desarrollaron a partir de las muestras de ADN conocidas de acuerdo con el diseño experimental (Tabla 1). Plantillas de ADN se amplificaron usando un Applied Biosystems (Foster City, CA) panel de Identifiler® Plus STR a dos concentraciones diferentes de ADN (1 ng y 200 pg). Los productos de PCR se detectaron en un Applied Biosystems 3130xl Genetic Analyzer, con la concentración más alta inyectada durante 5 segundos, y la cantidad más baja para 10 seg. (La cantidad más baja también se inyectó por sólo 5 segundos, pero los datos seg 10 eran más informativo.)
Métodos
Genotipo Inferencia

TrueAllele Casework tiene un modelo de probabilidad jerárquica que describe los datos de STR [17]. En este modelo bayesiano [20], la probabilidad genotipo antes proviene de prevalencia del alelo de la población, mientras que la función de verosimilitud compara combinaciones lineales de genotipos contribuyente (con distorsión experimental) a patrones de datos de STR observados. El equipo utiliza la cadena de Markov Monte Carlo (MCMC) búsqueda estadística [21] para tomar muestras de la distribución posterior de probabilidad conjunta. La probabilidad de genotipo posterior se informó para cada colaborador en cada locus. Para eliminar el sesgo de examen, donde conclusiones pueden ser afectados por el conocimiento de una referencia de comparación [22], TrueAllele infiere objetivamente genotipos únicamente a partir de los datos de pruebas.

Los datos electrónicos (.fsa) archivos fueron procesados ​​a través del sistema Casework TrueAllele, y las solicitudes de interpretación se formaron que supone 1, 2, 3, 4, 5, o 6 contribuyentes. Uno, dos y tres solicitudes contribuyentes fueron procesados ​​con una quemadura en el tiempo de 100.000 ciclos de MCMC, y se tomaron muestras de la distribución posterior conjunta de 100.000 ciclos. Las solicitudes que tienen cuatro o más colaboradores fueron quemados y muestras para el doble de ciclos. Todas las solicitudes se realizaron por duplicado, y se replican más, según sea necesario, posiblemente con tiempos de ejecución más largos.

Partido Estadísticas

La comparación de dos genotipos en relación con una población produce un cociente de probabilidad (LR) [23]. La LR no se ve afectada por las creencias previas acerca de la culpabilidad o la inocencia y se centra en lo bien que los datos de la evidencia apoyan una hipótesis de identificación. Un modelo matemático mejor puede provocar más información de identificación a partir de los mismos datos y (a través de un genotipo evidencia inferida) producir una más precisa LR [24]. El LR es un factor de Bayes, que considera el efecto de la evidencia en el cambio de las probabilidades de una identificación, de uso común en la ciencia forense para evaluar la fuerza probatoria de un partido de ADN [25]. La base diez logaritmo de la LR, "log (LR)" o "peso de la evidencia", es una medida aditiva estándar del cambio de información, expresada en unidades de "prohibición" [26].

Un usuario TrueAllele competente revisó los genotipos y combinar resultados computadora inferido. Debido a la incertidumbre genotipo, un contribuyente puede coincidir más de una referencia. El uso de la información de diseño del estudio, cada genotipo colaborador inferirse de un elemento de mezcla se combina con una referencia única conocida. Otra información de emparejamiento útil incluido el valor esperado LR genotipo contribuyente (Kullback-Leibler divergencia, o "KL") [27], las estadísticas de los partidos LR y el peso de la mezcla.

Estadísticas de los partidos se calcularon en relación con la Oficina Federal de los Estados Unidos de bases de datos de investigación de los alelos de afroamericanos, caucásicos, hispanos y poblaciones [28]. Se utilizó el valor LR conservadora más entre estas poblaciones. El registro reportado (LR) fue el promedio de dos carreras informáticas independientes, donde todos los valores de los partidos contribuyentes estaban dentro de una prohibición y los genotipos eran concordantes. En promedio, 3.1 carreras informáticas se llevaron a cabo por muestra. El coeficiente (valor theta) co-ascendencia se fijó a 1% [29].

...

Descargar como (para miembros actualizados) txt (33 Kb) pdf (287 Kb) docx (19 Kb)
Leer 20 páginas más »
Disponible sólo en Clubensayos.com