ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Caso empresa vinícola Hiui


Enviado por   •  9 de Septiembre de 2023  •  Apuntes  •  2.259 Palabras (10 Páginas)  •  80 Visitas

Página 1 de 10

Problema 3 Predecir el precio del vino (7.0 puntos)

Fuente: Kaggle. Red Wine Quality. https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009

 

La empresa vinícola HIUI se ha contactado con usted por su amplia experiencia en modelos de Pricing basados en métodos de analytics. La empresa Hiui se ubica en la ciudad de Chincha, donde este cultivo representa el 13.2% del valor bruto de producción agrícola. Además, la mayor parte de los eslabones de su cadena de suministro son situadas en la misma ciudad (siembran, cosecha y procesamiento de las uvas).

[pic 1]

Figura 1 – Perfil productivo agrícola de Chincha

Para entrenar su modelo de pricing, usted esta trabajando con la base de datos proporcionado por UCI machine learning repository disponible en Kaggle.

  • fixed acidity: la mayoría de los ácidos involucrados con el vino son fijos o no volátiles (no se evaporan fácilmente).
  • volatile acidity:  la cantidad de ácido acético en el vino, que en niveles demasiado altos puede provocar un sabor desagradable a vinagre.
  • citric acid:  encontrado en pequeñas cantidades, el ácido cítrico puede agregar 'frescura' y sabor a los vinos.
  • residual sugar:  la cantidad de azúcar que queda después de que se detiene la fermentación, es raro encontrar vinos con menos de 1.
  • Chlorides: la cantidad de sal en el vino
  • free sulfur dioxide: la forma libre de SO2. Equilibrio entre el SO2 molecular y el ion bisulfito.
  • total sulfur dioxide:  cantidad de formas libres de S02; en bajas concentraciones es mayormente indetectable en el vino.
  • density: la densidad del vino es cercana a la del agua, dependiendo del porcentaje de contenido de alcohol y azúcar.
  • pH:  describe qué tan ácido o básico es un vino en una escala de 0 (muy ácido) a 14 (muy básico).
  • sulphates:  un aditivo del vino que puede contribuir a los niveles de dióxido de azufre (S02), que actúa como antimicrobiano.
  • alcohol:  grado de alcohol del vino al ser envasado.

Output variable (precio según sus características sensoriales):

  • Price: precio en soles por botella de vino de 750mL

Trabajaremos con los datos disponible en el archivo base_vino.xlsx, los cuales ya están preprocesados. Se solicita lo siguiente:

  1. Recordando nuestros cursos de estadística, describa conceptualmente los criterios para la selección de los mejores predictores.  (solo explique 3).        1.5 puntos[pic 2]

Los criterios para la selección de los mejores predictores son :

1. Criterios de Información:

   - Los criterios de información, como el AIC (Criterio de Información de Akaike) y el BIC (Criterio de Información Bayesiano), buscan un equilibrio entre la capacidad de ajuste del modelo y la simplicidad.

   - Estos criterios penalizan modelos más complejos, favoreciendo aquellos que logran un buen ajuste con menos predictores.

2. Pruebas de Significancia Individual:

   - Cada predictor se evalúa individualmente mediante pruebas estadísticas (p-values) para determinar si contribuye significativamente al modelo.

   - Predictores con p-values bajos indican que son significativos y pueden ser incluidos en el modelo.

[pic 3]

3. Método Paso a Paso (Stepwise):

   - En este método, se agregan o eliminan predictores de manera iterativa según algún criterio, como la mejora en el AIC o el p-value.

   - Puede realizarse en varias direcciones: hacia adelante (agregar predictores), hacia atrás (eliminar predictores) o de manera mixta.

4. Validación Cruzada:

   - Se divide el conjunto de datos en conjuntos de entrenamiento y prueba para evaluar cómo el modelo generaliza a datos no vistos.

   - Diferentes combinaciones de predictores se prueban y se evalúa su rendimiento en múltiples conjuntos de prueba.

5. Método Jerárquico:

   - En este método, los predictores se introducen en el modelo en un orden determinado, basándose en el conocimiento previo o la importancia teórica.

   - La secuencia de inclusión se establece de acuerdo con el juicio del analista.

6.  Método de entrada forzada:

   - Se introducen todos los predictores simultáneamente.

Cada uno de estos criterios tiene sus ventajas y desventajas, y la elección depende del contexto y los objetivos del análisis. La selección de predictores es un proceso importante para construir un modelo que sea capaz de explicar y predecir los datos de manera efectiva.

  1. Determine la ecuación de predicción mediante el modelo de regresión lineal múltiple de la base de datos base_vino.xlsx. Grafique cada una de las variables (según amerite el tipo de dato). Use todas las variables y muestre los valores de los predictores y su reporte de pvalue. Interprete el modelo obtenido.         2.5 puntos

Código R studio :

# Cargar paquetes

library(openxlsx)

library(ggplot2)

library(GGally)

library(tidyverse)

library(PerformanceAnalytics)

# Cargar el archivo de Excel

data <- read.xlsx("C:/Users/rorozco/Downloads/base_vino.xlsx", sheet = 1)

# Corregir nombres de columnas con espacios

colnames(data) <- gsub(" ", "_", colnames(data))

# Analizar la relación entre variables

correlation_matrix <- round(cor(data, method = "pearson"), 3)

print(correlation_matrix)

chart.Correlation(data)

# Generar matriz de gráficos de dispersión

ggpairs(data, lower = list(continuous = "smooth"), diag = list(continuous = "barDiag"), axisLabels = "none")

...

Descargar como (para miembros actualizados)  txt (18 Kb)   pdf (1 Mb)   docx (2 Mb)  
Leer 9 páginas más »
Disponible sólo en Clubensayos.com