ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Modelos minería de datos


Enviado por   •  4 de Enero de 2020  •  Apuntes  •  467 Palabras (2 Páginas)  •  91 Visitas

Página 1 de 2

Análisis comparativo de los resultados de los modelos.

Teníamos 5 modelos principales que eran:

  • Support Vector Machine
  • Naive Bayes
  • Random Forest
  • Logistic Regression
  • Decision Tree

Aquí tenemos la comparativa de estos 5 modelos en general

[pic 1]

Vamos a ir viendo diferentes ejemplos para cada uno de los modelos recordando que van a variar dependiendo de las propiedades que elijamos y las comparaciones entre las propiedades y atributos

Support Vector Machine

El objetivo del algoritmo de la máquina de vectores de soporte es encontrar un hiperplano en un espacio N-dimensional (N, el número de entidades) que clasifique claramente los puntos de datos.

[pic 2]

[pic 3]

Naive Bayes

Naive Bayes es un clasificador de aprendizaje automático simple, efectivo y de uso común. Es un clasificador probabilístico que realiza clasificaciones utilizando la regla de decisión Máximo A Posteriori en un entorno bayesiano. También se puede representar utilizando una red bayesiana muy simple. Los clasificadores Naive Bayes han sido especialmente populares para la clasificación de texto, y son una solución tradicional para problemas como la detección de spam.

[pic 4]

Random Forest

Esta surge para realizar la combinación de árboles predictores en la que cada árbol depende de los valores de un vector aleatorio probado independientemente y con la misma distribución para cada uno de estos. Bagging también fue propuesto por Breiman (1994), basado en la combinación de clasificadores inestables como redes neuronales o árboles declasificación (donde ligeros cambios en el conjunto de entrenamiento llevan a construir otro clasificador), la idea central de bagging es la de entrenar muchos clasificadores débiles independientes, para luego combinarlos todos en un clasificador fuerte, usando muestreo con reemplazamiento en el conjunto de datos.

[pic 5]

Logistic Regression

La regresión es un método para modelar un valor objetivo basado en predictores independientes. Este método se utiliza principalmente para pronosticar y descubrir la relación de causa y efecto entre las variables. Las técnicas de regresión difieren principalmente en función del número de variables independientes y el tipo de relación entre las variables independientes y dependientes.

[pic 6]

Decision Tree

El clasificador de árboles de decisión, divide repetitivamente el área de trabajo (parcela) en una subparte identificando líneas. (Repetidamente, porque puede haber dos regiones distantes de la misma clase divididas por otras

...

Descargar como (para miembros actualizados)  txt (3.3 Kb)   pdf (883.9 Kb)   docx (939.6 Kb)  
Leer 1 página más »
Disponible sólo en Clubensayos.com