SISTEMA DE PREDICCION DE HOMICIDIOS CON MACHINE LEARNING
lucasxxxx Trabajo 8 de Mayo de 2021
4.240 Palabras (17 Páginas) 89 Visitas
UNIVERSIDAD COOPERATIVA DE COLOMBIA
SISTEMA DE PREDICCION DE HOMICIDIOS CON MACHINE LEARNING
KEVIN JULIAN QUINTERO DIAZ
EDISON YAIR NARANJO AMAYA
JAIME LEONARDO RIAÑO JIMENEZ
DOCENTE:
FREDY ALBERTO SIMANCA HERRERA
FACULTAD DE INGENIERIA
MINERIA DE DATOS
BOGOTÁ D.C.
2020
Tabla de contenido
1. INTRODUCCION 4
2. CONTEXTO 5
2.1. Machine Learning 5
3. PLANTEAMIENTO DEL PROBLEMA 7
4. JUSTIFICACION 8
5. OBJETIVOS 9
5.1. Objetivo General 9
5.2. Objetivos Específicos 9
6. METODOLOGÍA 10
6.1. sklearn.model_selection 10
6.2. Matplotlib 10
6.3. numpy 10
6.4. pandas 10
7. ANÁLISIS DE DATOS 11
7.1. Limpieza de datos 11
7.2. Cargando conjunto de datos en el marco de datos de pandas 11
7.3. Tasas anuales de homicidio: 15
7.4. Tasas mensuales de homicidio: 15
7.5. Tasas diarias de homicidio: 16
7.6. Tasas por hora de homicidio: 18
7.7. Tasas por sitio de homicidio: 20
7.8. Tasas por tipo de arma de homicidio: 21
7.9. Tasas de homicidio por género: 22
7.10. Tasas de homicidio por zonas: 23
8. Análisis de predicción de homicidios 24
8.1. Conjunto de datos 24
8.2. Modelo 26
9. REFERENCIAS BIBLIOGRAFICAS 27
Tabla de Ilustraciones
Figura 1: Tasa De Homicidios por Año en Bogotá, 2016, Fuente: Propia 15
Figura 2: Tasa de Homicidios por Mes en Bogotá, 2016, Fuente: Propia 16
Figura 3: Tasa de Homicidios por Dia en Bogotá, 2016, Fuente: Propia 17
Figura 4: Tasa de Homicidios por Hora en Bogotá, 2016, Fuente: Propia 18
Figura 5: Tasa de Homicidios por Sitio en Bogotá, 2016, Fuente: Propia 20
Figura 6: Tasa de Homicidios por Arma homicida en Bogotá, 2016, Fuente: Propia 21
Figura 7: Tasas de Homicidio por Genero en Bogotá, 2016, Fuente: Propia 22
Figura 8: Tasa de Homicidios por Zonas en Bogotá, 2016, Fuente: Propia 23
Figura 9: Grafico de Dispersion, Fuente: Propia 25
INTRODUCCION
Durante el paso del tiempo el machine learning se ha convertido en el pilar más importante de la inteligencia artificial, ya que este se basa en la capacidad de reconocer una gran cantidad de información a través de diferentes medios, los cuales son indispensables para clasificar datos y realizar tareas bastante específicas. Para esto es importante conocer y contar con diferentes métodos para obtener el resultado esperado. Inclusive esta herramienta se puede explotar mejor, ya que existen diferentes herramientas que se adaptan a un entorno gráfico, haciendo de este, un elemento poderoso y eficaz en el avance científico y tecnológico de las redes neuronales. En el caso de los homicidios se torna interesante y llamativo el poder predecir la cantidad de personas fallecidas por lugar, fecha, hora, entre otras variables.
Bajo estos estándares se pretende diseñar un modelo que nos permita clasificar y organizar de manera correcta una base de datos basada en homicidios de la ciudad de Bogotá en la cual podemos encontrar diferentes atributos, para ello utilizaremos diferentes algoritmos que nos permitan entender la metodología y el ámbito en el cual se manejan las predicciones en el machine learning,
CONTEXTO
Machine Learning
El ‘machine learning’ aprendizaje automático– es una rama de la inteligencia artificial que permite que las máquinas aprendan sin ser expresamente programadas para ello. Una habilidad indispensable para hacer sistemas capaces de identificar patrones entre los datos para hacer predicciones. Esta tecnología está presente en un sinfín de aplicaciones como las recomendaciones de Netflix o Spotify, las respuestas inteligentes de Gmail o el habla de Siri y Alexa.
“En definitiva, el ‘machine learning’ es un maestro del reconocimiento de patrones, y es capaz de convertir una muestra de datos en un programa informático capaz de extraer inferencias de nuevos conjuntos de datos para los que no ha sido entrenado previamente”, explica José Luis Espinoza, científico de datos de BBVA México. Esta capacidad de aprendizaje se emplea también para la mejora de motores de búsqueda, la robótica, el diagnóstico médico o incluso la detección del fraude en el uso de tarjetas de crédito.
Algoritmos más Usados en el Machine Learning
- Algoritmos de regresión
Los algoritmos de regresión se aplican en modelos de machine learning que buscan estimar y determinar la existencia de relaciones entre variables que forman parte del objeto de estudio. El análisis de regresión se concentra en fijar como dependiente una variable y ver su comportamiento con otra serie de variables independientes y/o cambiantes. Con estos modelos podemos construir proceso de aprendizaje automático que facilite la predicción de resultados y pronósticos.
- Algoritmos Bayesianos
Los algoritmos de machine learning conocidos como bayesianos reciben esta denominación porque están basados en el teorema de bayes. Dentro de su funcionamiento realizan clasificaciones de cada valor como independiente de cualquier otro. Esto permite predecir con mucha efectividad una clase o categoría dentro de un conjunto dado de características mediante modelos probabilísticos.
- Algoritmos de Agrupación
Dentro de los algoritmos de machine learning que son implementados para aprendizaje no supervisado se encuentran los algoritmos de agrupación. Gracias a ellos podemos establecer categorías dentro datos no etiquetados, es decir, podemos ordenar datos que pertenecen a grupos indefinidos.
Estos algoritmos realizan búsquedas dentro del conjunto de datos, estableciendo una variable de representación dentro del grupo y posteriormente de forma iterativa asigna en cada punto de datos esa variable, según las características que determinemos.
- Algoritmos de Árbol de Decisiones
Los árboles de decisión son implementados como algoritmos de machine learning debido a que, al ser similares a un diagrama de flujo, utilizan un método determinado de cruce para representar los posibles resultados que ocasionaría la toma de una decisión. En estos modelos cada nodo representa una prueba en una variable específica y las ramas muestran los resultados que deja dicha prueba como producto.
- Algoritmos de redes Neuronales
Dentro de los tipos de algoritmos de machine learning más interesantes se encuentran los que conocemos como redes neuronales. Estos comprenden unidades dispuestas en capas. Cada una de estas capas posee una conexión con las capas anexas. Su funcionamiento pretende emular el comportamiento de procesamiento de información del cerebro humano.
Todos estos elementos de procesamiento de datos están íntimamente interconectados y trabajan de forma conjunta para darle solución a los problemas específicos que deban analizar. Los algoritmos de redes neuronales son usualmente implementados para establecer modelos de relaciones no lineales o donde la relación de las variables de ingreso a un sistema con un alto nivel de complejidad y su comprensión suele ser difícil de entender.
...