ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

MÓDULO V: CREAR UN MODELO BÁSICO Y CONTAR UNA HISTORIA


Enviado por   •  25 de Junio de 2020  •  Informes  •  678 Palabras (3 Páginas)  •  132 Visitas

Página 1 de 3

MÓDULO V: CREAR UN MODELO BÁSICO Y CONTAR UNA HISTORIA

• Modelado:

El modelado es la etapa de la metodología de la ciencia de datos en la que el científico de datos puede probar la salsa y determinar si tiene buen sabor o si necesita más condimentos. Ahora apliquemos el caso práctico a la etapa de modelado de la metodología de la ciencia de datos. Aquí analizaremos uno de los muchos aspectos de la creación de modelos.

El ajuste de los parámetros que permite utilizar el modelo. Con un conjunto de entrenamiento preparado se puede crear el primer modelo de clasificación de árbol de decisión para las reinternaciones por insuficiencia cardíaca congestiva. Dado que buscamos pacientes con un alto riesgo de reinternación, el resultado de interés será que la reinternación por insuficiencia cardíaca congestiva sea un resultado positivo. En este primer modelo, la clasificación de los resultados positivos y negativos tuvo una precisión general del 85%. Si bien esa cifra puede sonar bien, representa sólo un 45% de los resultados positivos. Las reinternaciones reales están bien clasificadas, lo que significa que el modelo no es muy preciso.

Por lo tanto, la pregunta es la siguiente: ¿Cómo se puede mejorar la precisión que tiene el modelo al predecir los resultados positivos? Para la clasificación de árbol de decisión el parámetro que más conviene ajustar es el costo relativo de los resultados afirmativos y negativos mal clasificados. Piénselo de la siguiente manera: cuando se clasifica mal un no reinternación verdadera y se toman medidas para reducir el riesgo de ese paciente, el costo de ese error es la intervención que se realiza en vano. Los estadísticos lo llaman error tipo 1 o falso positivo. Sin embargo, cuando se clasifica mal una reencarnación verdadera y no se toman medidas para reducir el riesgo, el costo de ese error es la reinternación y todos los costos asociados, además del trauma que sufre el paciente. Ese es un error tipo 2 o falso negativo. Cómo se puede ver, los costos de los dos tipos de errores de clasificación pueden ser muy diferentes. Por ese motivo es razonable ajustar las ponderaciones relativas de la clasificación incorrecta de los resultados positivos y negativos. La configuración predeterminada es uno a uno, pero el algoritmo de árbol de decisión permite que se establezcan valores más altos para los resultados positivos. Para el segundo modelo el costo relativo se estableció en 9 a 1. Si bien esta es una proporción muy alta brinda mayor información sobre el comportamiento del modelo. Esta vez el modelo clasificó correctamente un 97% de los resultados positivos. Pero lo hizo a expensas de una precisión muy baja para los resultados negativos. Lo que arroja una precisión general de sólo un 49%. Evidentemente este no fue un modelo eficaz. El problema de este resultado es la gran cantidad de falsos

...

Descargar como (para miembros actualizados)  txt (4.1 Kb)   pdf (36.4 Kb)   docx (7.9 Kb)  
Leer 2 páginas más »
Disponible sólo en Clubensayos.com