ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Tropsha Las Mejores Prácticas Para Desarrollo De Modelo De QSAR, Validación, Y Explotación

CarinBO24 de Octubre de 2012

9.064 Palabras (37 Páginas)903 Visitas

Página 1 de 37

1 Introducción: Principios Básicos y Proceso laboral de QSAR Profético el Modelado del desarrollo Rápido de información y tecnologías de comunicación durante las pocas décadas pasadas dramáticamente han cambiado nuestras capacidades de recogimiento, análisis, almacenaje y diseminación todos los tipos de datos. Este proceso ha tenido una influencia profunda sobre la investigación científica en muchas disciplinas, incluyendo el desarrollo de las generaciones nuevas de medicinas eficaces y selectivas. Bases de datos grandes que contienen millones de compuestos químicos probados en varios ensayes biológicos como PubChem [1] están cada vez más disponibles como colecciones en línea (recientemente repasadas por Oprea y Tropsha; [2] mirar también el comentario reciente por Williams et al. [3]). Para encontrar la nueva medicina conduce, hay una necesidad de los procedimientos eficientes y robustos que pueden ser usados proteger bases de datos químicas y bibliotecas virtuales contra moléculas con actividades sabidas o propiedades. A este final, Relaciones de Actividad de estructura Cuantitativas (QSAR) el modelado proporcionan un medio eficaz tanto para la exploración como para la explotación de la relación entre la estructura química y su acción biológica hacia el desarrollo de candidatos de medicina nuevos. El acercamiento de QSAR generalmente puede ser descrito como un uso de métodos de análisis de datos y estadística al desarrollo de los modelos que con exactitud podrían predecir actividades biológicas o propiedades de compuestos basados en sus estructuras. Cualquier método QSAR generalmente puede ser definido como un uso de métodos matemáticos y estadísticos al problema de encontrar relaciones empíricas (QSAR modelos) de la forma Pi=k ' (D1, D2, …, Dn), donde la Pi es actividades biológicas (u otras propiedades de interés) de moléculas, D1, D2, …, Dn es calculado (o, a veces, experimentalmente medido) propiedades estructurales (descriptores moleculares) de compuestos, y la k ' son unos empíricamente establecieron la transformación matemática que debería ser aplicada a descriptores para calcular los valores de propiedad para todas las moléculas (la Figura 1). El objetivo de modelado de QSAR es de establecer una tendencia en los valores descriptivos, que paralelos la tendencia en la actividad biológica. En la esencia, todos los accesos de QSAR implican, directamente o indirectamente, un principio de semejanza simple, que durante mucho tiempo ha proporcionado una fundación para la química experimental medicinal: esperan compuestos con estructuras similares para tener actividades similares biológicas. La descripción detallada de los principios principales de modelado de QSAR está fuera del alcance de este papel; la descripción de muchos QSAR populares técnicas que modelan incluyendo técnicas estadísticas y datamining así como accesos a cálculos descriptivos podría ser encontrada en muchas revisiones y monografías, p.ej., [4, 5]). Aquí, comentamos los aspectos generales más críticos de desarrollo modelo y, el más pretenciosamente, la validación que es sobre todo importante en el contexto de usar modelos de QSAR para la selección virtual. La mayor parte de nuestra discusión captura tendencias que el autor ha u observado o ha contribuido en los 20 años pasados de investigación activa en el campo. La información adicional importante que concierne ambos errores comunes así como prácticas establecidas en el QSAR que modela el campo puede ser encontrada en otros ensayos críticos sobre el sujeto, p.ej., por Stouch et al. [6] y Dearden et al. [7

Nuestra experiencia en el desarrollo de modelo de QSAR y la validación nos ha conducido a establecer una estrategia [8] compleja que es resumida en la Figura 2. Esto describe QSAR profético el proceso laboral que modela enfocado la entrega modelos validados y en última instancia, los golpes computacionales que en última instancia deberían confirmar la validación experimental. Comenzamos por con cuidado curar estructuras químicas y, de ser posible, asociamos actividades biológicas para preparar el juego de datos para cálculos subsecuentes. Esta publicación de evaluación y dirección de la exactitud de datos correctamente no ha sido dirigida en la literatura y hablamos de algunos aspectos de este componente crítico del proceso laboral debajo. Entonces, una fracción de compuestos (típicamente, el 10-20 %) es seleccionada al azar como un juego de evaluación externo (un pliegue de n más riguroso el protocolo de validación externo puede ser empleado cuando el juego de datos al azar es dividido en la n casi igualan partes y luego la n ' 1 partes sistemáticamente son usadas para el desarrollo modelo y la fracción restante de compuestos es usada para la evaluación modelo). El protocolo de Exclusión de Esfera puesto en práctica en nuestro laboratorio [9, 10] entonces es usado racionalmente dividir el subconjunto restante de compuestos (el juego de modelado) en múltiple educación y los juegos de prueba que son usados para el desarrollo modelo y la validación, respectivamente (accesos alternativos racionales para dividir el juego de modelado sobre la educación diversa y representativa y prueban juegos podría ser inventado también). Empleamos múltiples técnicas QSAR basadas en la exploración combinatoria de todos los pares posibles de juegos descriptivos y varias técnicas de análisis de datos supervisadas (combi-QSAR) y seleccionamos modelos caracterizados por la alta exactitud en la predicción tanto educación como probamos datos de juegos. Los umbrales de aceptabilidad modelos típicamente son caracterizados por el valor aceptable más bajo de la cruz " se marchan un hacia fuera " R2 validado (q2) para el juego de educación y por R2 convencional para el juego de prueba; nuestros valores de falta son 0.6 tanto para q2 como para R2. Todos los modelos validados finalmente son probados en un conjunto que usa el juego de evaluación externo. El paso crítico de la validación externa es el empleo de dominios de aplicabilidad (el ANUNCIO), que es definido únicamente para cada modelo usado en el acuerdo general (el conjunto) la predicción del juego externo. Si la validación externa demuestra el poder significativo profético de los modelos los empleamos para la selección virtual de bases de datos disponibles químicas (p.ej., el ZINC [11]) para identificar compuestos supuestos activos y trabajo con los colaboradores que podrían validar tales golpes experimentalmente.

Alexander Tropsha es la K. H. El Sotavento Distinguió al Profesor y la Silla de la División de Química Medicinal y Productos Naturales en la Escuela Eshelman de Farmacia, la Colina de UNC-CAPILLA. Él recibió el doctorado en el Producto químico Enzymology en 1986 de la Universidad Estatal de Moscú, Rusia. Él inmigró a los Estados Unidos en 1989 y ha sido afiliado UNC desde entonces. Sus intereses de investigación están en las áreas de Ordenador - el Diseño de Medicina Ayudado, la Toxicología Computacional, Cheminformatics, y la Bioinformática Estructural. Su investigación es apoyada por múltiples subvenciones del NIH, NSF, EL MINISTERIO DEL MEDIO AMBIENTE, y sociedades anónimas de responsabilidad limitada. Él es un miembro de varia pasarela editorial de diarios científicos, el miembro permanente de la Sección de Estudio de BDMA en el NIH y un miembro elegido del Consejo y la vicesilla de Cheminformatics internacional y la Sociedad QSAR en 2005-2010

Así, los modelos que son resultado de QSAR profético el proceso laboral que modela (la Figura 2) pueden ser usados priorizar la selección de productos químicos para la validación experimental. De hecho, es cada vez más crítico incluir la validación experimental como la aserción última de la predicción a base de modelo. Notamos que el foco sobre la validación experimental cambia el énfasis en la aseguración (el de la mejor) estadística buena para el modelo que encaja datos sabidos experimentales hacia la generación de hipótesis que puede hacer testamento sobre compuestos de bioactive pretendidos. Así, la salida del modelado tiene el exactamente mismo formato que la entrada, p. ej., estructuras químicas y actividades (predichas) que hacen la interpretación modela y la utilización completamente sin costuras para químicos medicinales. Algunos de nuestros estudios de aplicación demostrando la capacidad de modelos para identificar los golpes computacionales que posteriormente fueron validados experimentalmente son descritos debajo. Ahora hablamos de procedimientos específicos (las mejores prácticas) que debería ser seguido dentro de cada componente individual del proceso laboral.

2 Las Mejores Prácticas para los Elementos Claves de QSAR el Proceso laboral que Modela

En esta sección hablamos de protocolos específicos y procedimientos que en nuestra experiencia deberían ser seguidos para permitir el desarrollo de modelos de QSAR confiables y proféticos. La discusión sigue el camino del proceso laboral resumido en la Figura 2, de la preparación de datos para modelar el desarrollo y la validación al uso de modelos para la predicción externa y la selección virtual.

2.1 La Importancia de Datos Químicos Curation en Modelado de QSAR

Modelers molecular típicamente analiza datos generados por otros investigadores (experimentales). Por consiguiente, cuando esto viene a la calidad de datos experimental ellos son siempre a la merced de los proveedores de datos. Prácticamente cualquier estudio de cheminformatics implica el cálculo de los descriptores químicos que esperan con exactitud reflejar los detalles intrincados de ser la base de estructuras químicas. Obviamente, cualquier error en la estructura traduce en la inhabilidad de calcular

...

Descargar como (para miembros actualizados) txt (59 Kb)
Leer 36 páginas más »
Disponible sólo en Clubensayos.com