Modelos minería de datos

Anibal Jose Peña PerezApuntes4 de Enero de 2020

467 Palabras (2 Páginas)217 Visitas

Página 1 de 2

Análisis comparativo de los resultados de los modelos.

Teníamos 5 modelos principales que eran:

Support Vector Machine
Naive Bayes
Random Forest
Logistic Regression
Decision Tree

Aquí tenemos la comparativa de estos 5 modelos en general

[pic 1]

Vamos a ir viendo diferentes ejemplos para cada uno de los modelos recordando que van a variar dependiendo de las propiedades que elijamos y las comparaciones entre las propiedades y atributos

Support Vector Machine

El objetivo del algoritmo de la máquina de vectores de soporte es encontrar un hiperplano en un espacio N-dimensional (N, el número de entidades) que clasifique claramente los puntos de datos.

[pic 2]

[pic 3]

Naive Bayes

Naive Bayes es un clasificador de aprendizaje automático simple, efectivo y de uso común. Es un clasificador probabilístico que realiza clasificaciones utilizando la regla de decisión Máximo A Posteriori en un entorno bayesiano. También se puede representar utilizando una red bayesiana muy simple. Los clasificadores Naive Bayes han sido especialmente populares para la clasificación de texto, y son una solución tradicional para problemas como la detección de spam.

[pic 4]

Random Forest

Esta surge para realizar la combinación de árboles predictores en la que cada árbol depende de los valores de un vector aleatorio probado independientemente y con la misma distribución para cada uno de estos. Bagging también fue propuesto por Breiman (1994), basado en la combinación de clasificadores inestables como redes neuronales o árboles declasificación (donde ligeros cambios en el conjunto de entrenamiento llevan a construir otro clasificador), la idea central de bagging es la de entrenar muchos clasificadores débiles independientes, para luego combinarlos todos en un clasificador fuerte, usando muestreo con reemplazamiento en el conjunto de datos.

[pic 5]

Logistic Regression

La regresión es un método para modelar un valor objetivo basado en predictores independientes. Este método se utiliza principalmente para pronosticar y descubrir la relación de causa y efecto entre las variables. Las técnicas de regresión difieren principalmente en función del número de variables independientes y el tipo de relación entre las variables independientes y dependientes.

[pic 6]

Decision Tree

El clasificador de árboles de decisión, divide repetitivamente el área de trabajo (parcela) en una subparte identificando líneas. (Repetidamente, porque puede haber dos regiones distantes de la misma clase divididas por otras

[pic 7]

Opinión acerca de las comparaciones de los diferentes modelos

En la primera grafica pudimos observar solamente una breve diferencia que fue de milésimas en los resultados de la evaluación de los diferentes modelos por ende no hay un mejor modelo que podamos sacar, sino que cada uno se ajusta para las diferentes tareas, funciones y necesidades del usuario.

En unos por ejemplo se noto el gran rango que había entre los limites en otros se vio los posibles puntos y encuentros que pudieran hacer o causar errores.

...

Descargar como (para miembros actualizados) txt (3 Kb) pdf (884 Kb) docx (940 Kb)

Leer 1 página más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com