Modelos minería de datos
Anibal Jose Peña PerezApuntes4 de Enero de 2020
467 Palabras (2 Páginas)125 Visitas
Análisis comparativo de los resultados de los modelos.
Teníamos 5 modelos principales que eran:
- Support Vector Machine
- Naive Bayes
- Random Forest
- Logistic Regression
- Decision Tree
Aquí tenemos la comparativa de estos 5 modelos en general
[pic 1]
Vamos a ir viendo diferentes ejemplos para cada uno de los modelos recordando que van a variar dependiendo de las propiedades que elijamos y las comparaciones entre las propiedades y atributos
Support Vector Machine
El objetivo del algoritmo de la máquina de vectores de soporte es encontrar un hiperplano en un espacio N-dimensional (N, el número de entidades) que clasifique claramente los puntos de datos.
[pic 2]
[pic 3]
Naive Bayes
Naive Bayes es un clasificador de aprendizaje automático simple, efectivo y de uso común. Es un clasificador probabilístico que realiza clasificaciones utilizando la regla de decisión Máximo A Posteriori en un entorno bayesiano. También se puede representar utilizando una red bayesiana muy simple. Los clasificadores Naive Bayes han sido especialmente populares para la clasificación de texto, y son una solución tradicional para problemas como la detección de spam.
[pic 4]
Random Forest
Esta surge para realizar la combinación de árboles predictores en la que cada árbol depende de los valores de un vector aleatorio probado independientemente y con la misma distribución para cada uno de estos. Bagging también fue propuesto por Breiman (1994), basado en la combinación de clasificadores inestables como redes neuronales o árboles declasificación (donde ligeros cambios en el conjunto de entrenamiento llevan a construir otro clasificador), la idea central de bagging es la de entrenar muchos clasificadores débiles independientes, para luego combinarlos todos en un clasificador fuerte, usando muestreo con reemplazamiento en el conjunto de datos.
[pic 5]
Logistic Regression
La regresión es un método para modelar un valor objetivo basado en predictores independientes. Este método se utiliza principalmente para pronosticar y descubrir la relación de causa y efecto entre las variables. Las técnicas de regresión difieren principalmente en función del número de variables independientes y el tipo de relación entre las variables independientes y dependientes.
[pic 6]
Decision Tree
El clasificador de árboles de decisión, divide repetitivamente el área de trabajo (parcela) en una subparte identificando líneas. (Repetidamente, porque puede haber dos regiones distantes de la misma clase divididas por otras
[pic 7]
Opinión acerca de las comparaciones de los diferentes modelos
En la primera grafica pudimos observar solamente una breve diferencia que fue de milésimas en los resultados de la evaluación de los diferentes modelos por ende no hay un mejor modelo que podamos sacar, sino que cada uno se ajusta para las diferentes tareas, funciones y necesidades del usuario.
En unos por ejemplo se noto el gran rango que había entre los limites en otros se vio los posibles puntos y encuentros que pudieran hacer o causar errores.
...