ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Mineria de datos


Enviado por   •  24 de Agosto de 2022  •  Tareas  •  569 Palabras (3 Páginas)  •  27 Visitas

Página 1 de 3

PARCIAL TERCER CORTE

MINERIA DE DATOS

JUAN JOSE OCHOA ORTIZ        

CAMILO ENRIQUE GALAN VERA                                                                                        

DOCENTE                                                                                                        

CARLOS ENRIQUE CABRERA MARTINEZ

UNIVERSIDAD SAN BUENAVENTURA

FACULTAD DE INGENIERIA

INGENIERIA DE SISTEMAS

BOGOTA D.C.

2020

Descripción y contextualización

El vino es la bebida que resulta de la fermentación alcohólica del mosto de uvas. Existen factores como el proceso de vinificación, la variedad y el método de cultivo, que marcan diferencias en los atributos de un vino, sin embargo, el llamado terruño, influenciado por la luminosidad, altitud, latitud, régimen pluvial, pendiente, orientación y tipo de suelo, es el que define la tipicidad de la uva y del vino, lo cual se expresa en el contenido de azúcar, acidez, color y aroma, entre otros.

Según lo anterior, los porcentajes de alcohol, acido volátil y dióxido de sulfuro pueden variar cambiando así la calidad en los resultados que se obtienen.

Justificación del proyecto.

  • Se realizará un análisis de datos para obtener una estimación de la calidad del Vino, partiendo de varias características que presenta este como sus porcentajes de alcohol, acido volátil y dióxido de sulfuro.

Objetivo

  • Por medio de la técnica de minería de datos llamada arboles de decisión, se realizará el proceso de análisis de datos, analizando algunas características

Anteriormente mencionadas.

Algoritmo propuesto (Arboles de decisión).

Es un método analítico que a través de una representación esquemática de las alternativas disponible facilita la toma de mejores decisiones, especialmente cuando existen riesgos, costos, beneficios y múltiples opciones.

Transformación de datos.

El archivo punto csv contiene varios datos nulos y otros en blanco, sin embargo, como se mencionaba anteriormente el análisis solo se hará sobre las siguientes 4 variables:

  • Alcohol.
  • Acido volátil.
  • Dióxido de sulfuro.

Desarrollo

A continuación, se presenta el código del algoritmo realizado en el lenguaje de programación R.

library(rpart)

library(rpart.plot)

url<-"http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv"

wine <- read.table(file=url, header = T, sep=";")

knitr:kable(head(wine), caption = "Resumen de datos")

...

Descargar como (para miembros actualizados)  txt (3.1 Kb)   pdf (80.3 Kb)   docx (24.3 Kb)  
Leer 2 páginas más »
Disponible sólo en Clubensayos.com