APLICACIÓN DE TEOREMA DE BAYES BASADO EN DOS ENFOQUES NAIVES BAYES Y REDES BAYESIANAS PARA LA CLASIFICACION DE TIPOS DE VIDRIOS
Sergio David RamosInforme13 de Octubre de 2022
5.737 Palabras (23 Páginas)54 Visitas
APLICACIÓN DE TEOREMA DE BAYES BASADO EN DOS ENFOQUES NAIVES BAYES Y REDES BAYESIANAS PARA LA CLASIFICACION DE TIPOS DE VIDRIOS E INDENTICACION DE SINTOMAS DE PATOLOGIAS DE COLICOS EN CABALLOS
SERGIO DAVID RAMOS UNI
JESÚS EMILIO PINTO LOPERA
DOCENTE
UNIVERSIDAD DE LA AMAZONIA
FACULTAD DE INGENIERÍA
INGENIERÍA DE SISTEMAS
FLORENCIA, COLOMBIA
2022
Introducción
En la actualidad existen diferentes mecanismos matemáticos que nos permiten identificar y representar problemas de manera eficaz, por lo que el teorema de bayes es un sistema de cálculo de probabilidad puesto que nos permite medir la incertidumbre con respectos a eventos en la actualidad (Soto, 2011)
El teorema de bayes nos permite representar científicamente fenómenos de acuerdo con dos enfoques, Naves Bayes y redes Bayesianas. Para tal caso representamos como modelo clasificador naives bayes que son modelos muy útiles la cual nos anticipa sucesos en la actualidad y de esta manera tomar decisiones de manera eficiente. Con énfasis a lo anterior planteado se implementará el modelo de Naives Bayes para la identificación de materiales independientes para la identificación y clasificación de diferentes tipos de vidrios encontrados en la actualidad. De la misma manera se implementará una red bayesiana que representa las relaciones probabilísticas entre enfermedades y síntomas para la predicción de cólicos basado en caballos.
Lo anterior lo evidenciamos en lenguaje de programación Python para lo que representa el desarrollo de los modelos Naives Bayes y Redes Bayesianas para el entrenamiento y prueba, finalmente se mostraran los resultados de las pruebas realizadas en una matriz de confusión para evaluar la efectividad de los modelos y sus respectivas conclusiones.
Tabla de contenido
Introducción 2
1. Marco Conceptual 5
1.1. Lenguaje de Programación 5
1.2. Teorema de Bayes 5
1.2.1. Naives Bayes 6
1.2.2. Red Bayesiana 8
2. Marco Metodológico 10
2.1 Generalidades 10
2.2 Base de Datos 11
2.2.1 Naives Bayes 11
2.2.2 Red Bayesiana 11
3. Desarrollo del Algoritmo 18
3.1 Naives Bayes 18
3.1.1 Importación de librerías 18
3.1.2 Carga base de datos 18
3.1.3 Preprocesamiento de los datos 19
3.1.4 División de los datos 19
3.1.5 Creación del modelo bayesiano 20
3.1.6 Resultados Modelo 20
3.2 Red Bayesiana 20
3.2.1 Importación de librerías 21
3.2.2 Cargue y configuración base de datos 21
3.2.3 Modelo grafico red de bayes 22
3.2.4. Creación modelo red de bayes 23
3.2.5 Resultados Red Bayes 24
4. Resultados 25
4.2 Naives Bayes 25
4.2 Red Bayes 26
5. Conclusiones 28
Referencias 29
Marco Conceptual
Para este apartado se da a conocer los modelos y procedimiento implementados para llevar a cabo el ejercicio de simulación y prueba de los modelos anteriormente mencionados.
Lenguaje de Programación
Como lenguaje de programación utilizaremos Python en su versión 3.10 debido a su alta demanda y comunidad es uno de los lenguajes con mayor soporte y características en sus librerías que nos permite representar modelos matemáticos con alta complejidad de manera fácil y eficiente, de la misma manera utilizaremos Spyder como editor de código.
Teorema de Bayes
El teorema de bayes lo podemos representar el cual se refiere al calculo de probabilidad de que ocurra un evento A dado que ha ocurrido un evento B, es decir primero se produce un acontecimiento para que posteriormente suceda el evento que se quiere determinar su probabilidad (Terreros et al., 2019). Entonces si B es un suceso cualquiera del que se conoce las probabilidades condicionadas entonces la probabilidad viene dada por la expresión:[pic 1][pic 2]
[pic 3]
Donde:
, son las probabilidades a priori [pic 4]
, es la probabilidad de B en cada hipótesis [pic 5][pic 6]
, son las probabilidades a posteriori [pic 7]
Ecuación de Bayes
Nos permite calcular la probabilidad condicional , de cualquiera de los eventos dado [pic 8][pic 9][pic 10]
[pic 11]
Naives Bayes
Naives Bayes es una clase especial de algoritmos de clasificación y aprendizaje automático (Machine Learning) basada en una técnica de clasificación estadística llamada teorema de Bayes, la cual asume variables independientes son las predictoras en un conjunto de datos (Algoritmos Naive Bayes: Fundamentos e Implementación | by Victor Roman | Ciencia y Datos | Medium, n.d.).
Ejemplo:
Nos encontramos en la oficina y en un momento dado miramos pasar muy rápido que no sabemos si es nuestro compañero Alexander o Brayan, dada la información tenemos que,
- Alexander viene a la empresa 3 días a la semana
- Brayan viene a la oficina 1 día a la semana
Dada la información anterior sabemos que Alexander y Brayan vienen 4 días a la semana, la probabilidad de que la persona sea vista está dada por:
[pic 12]
[pic 13]
Cuando vimos a la persona pasar, vimos que ellos llevaban una chaqueta roja. También sabemos lo siguiente:
- Alexander viste de rojo 2 veces a la semana.
- Brayan viste de rojo 3 veces a la semana.
Así que, para cada semana de trabajo, que tiene cinco días, podemos inferir lo siguiente:
La probabilidad de que Alexander vista de rojo es:
[pic 14]
La probabilidad de que Brayan vista de rojo
[pic 15]
De forma que las probabilidades reales son:
[pic 16]
[pic 17]
[pic 18]
[pic 19]
[pic 20]
[pic 21]
Tenemos que la probabilidad de que hallamos visto a alexander es del 67 % y Brayan del 33%
Red Bayesiana
Una red Bayesiana es un modelo probabilístico grafico acíclico, la cual representa un conjunto de variables aleatorias y sus dependencias condicionales o relaciones causales entre variables aleatorias, en las redes bayesianas se utilizan distribuciones de probabilidad condicional. (2. Red Bayesiana — Pgmpy 0.1.15 Documentación, n.d.)
Ejemplo:
Supongamos que tenemos dos eventos los cuales son causales de que una planta se marchite, para ello tenemos la variable sol la cual nos indica si esta haciendo sol o no, también identificamos que, si el sol tiene efecto sobre el suelo muy seco y causa efecto sobre la planta, de esta manera podemos modelar la siguiente situación, Figura 1
[pic 22]
Figura 1Modelo Ejemplo Red Bayes
La función de probabilidad conjunta es:
[pic 23]
donde los nombres de las variables han sido abreviados a PL = Planta marchita, T = Tierra seca, y S = Soleado.
En el modelo nos podemos representar preguntas como ¿Cuál es la probabilidad de que este haciendo sol y que la planta se pueda marchitar? Usando la fórmula de probabilidad condicional
[pic 24]
Tabla 1 Probabilidad condicionada para P(S)
T | 0.5 |
F | 0.5 |
[pic 25]
Tabla 2 Probabilidad condicionada para P(T|S)
T | T | 0.8 |
F | 0.2 | |
F | T | 0.1 |
F | 0.9 |
[pic 26]
Tabla 3 Probabilidad condicionada para P(PL|S,T)
T | T | T | 0.9 |
F | 0.1 | ||
F | T | 0.4 | |
F | 0.6 | ||
F | T | T | 0.6 |
F | 0.4 | ||
F | T | 0.2 | |
F | 0.8 |
Marco Metodológico
2.1 Generalidades
En el desarrollo del presente informe de implemento el teorema de bayes el cual se implementa el clasificador Naives Bayer donde nos permite conocer a través de probabilidades la identificación de tipos de vidrios basado en variables independientes, por otro lado, se implementa una red bayesiana la cual a través de sus probabilidades obtenemos que un caballo tenga síntomas de cólicos basado en variables causales o relaciones que existen entre las mismas utilizando teorema de bayes.
...