Diagnóstico de regresión, selección de modelos y regresión con variables Binarias
mantagua12010Tarea12 de Julio de 2020
1.449 Palabras (6 Páginas)155 Visitas
Taller 5. Diagnóstico de regresión, selección de modelos y regresión con variables Binarias
Datos: Hamburguesas
[pic 1] |
Primera parte. En un negocio de venta de hamburguesas, se desea explicar las ventas en función del precio promedio de las hamburguesas y los gastos en publicidad.
- Corrida de modelos
Modelo con variables de nivel
Resumen del modelo | |||||
Modelo | R | R cuadrado | R cuadrado corregida | Error típ. de la estimación | Durbin-Watson |
1 | ,670a | ,448 | ,433 | 4,88612 | 2,183 |
El valor del coeficiente de determinación es 0,448, lo que dice que el 44,8% de la variabilidad de las ventas se ve explicada por el precio y los gastos en publicidad.
ANOVA | |||||
Modelo | Suma de cuadrados | gl | Media cuadrática | F | Sig. |
Regresión | 1396,539 | 2 | 698,269 | 29,248 | 0 |
Residual | 1718,943 | 72 | 23,874 | ||
Total | 3115,482 | 74 |
|
|
|
La tabla de análisis de varianza muestra un p-valor de 0,000 lo que dice que al menos una de las variables es significativa.
Coeficientes | |||||||
Modelo | Coeficientes no estandarizados | Coeficientes tipificados | t | Sig. | Intervalo de confianza de 95,0% para B | ||
B | Error típ. | Beta | Límite inferior | Límite superior | |||
(Constante) | 118,914 | 6,352 | 18,722 | ,000 | 106,252 | 131,575 | |
price | -7,908 | 1,096 | -,632 | -7,215 | ,000 | -10,093 | -5,723 |
advert | 1,863 | ,683 | ,239 | 2,726 | ,008 | ,501 | 3,225 |
Ahora, por un aumento de una unidad en el precio las ventas caen en 7,908 unidades. Y por otra parte, un aumento de una unidad en publicidad hace que las ventas aumenten en 1,863 unidades.
Modelo con los logaritmos naturales
Resumen del modelo | |||||
Modelo | R | R cuadrado | R cuadrado corregida | Error típ. de la estimación | Durbin-Watson |
1 | ,685a | ,469 | ,454 | ,02709 | 2,146 |
Este modelo presenta un coeficiente de determinación de 0,469 siendo más alto que el modelo con las variables en nivel.
ANOVA | |||||
Modelo | Suma de cuadrados | gl | Media cuadrática | F | Sig. |
Regresión | ,047 | 2 | ,023 | 31,810 | ,000b |
Residual | ,053 | 72 | ,001 | ||
Total | ,100 | 74 |
|
|
|
En este modelo también se aprecia un valor significativo de la prueba F lo cual indica que al menos una de las variables es significativa para explicar el log de las ventas.
Coeficientes | |||||||
Modelo | Coeficientes no estandarizados | Coeficientes tipificados | t | Sig. | Intervalo de confianza de 95,0% para B | ||
B | Error típ. | Beta | Límite inferior | Límite superior | |||
(Constante) | 2,310 | ,060 | 38,564 | ,000 | 2,191 | 2,430 | |
log_price | -,575 | ,079 | -,622 | -7,246 | ,000 | -,733 | -,417 |
log_advert | ,045 | ,014 | ,286 | 3,327 | ,001 | ,018 | ,073 |
Ambos p-valores son significativos es decir menos a 0,05.
- Realice un diagnóstico completo de cada regresión incluyendo:
- Análisis de residuos: Los residuos se cargan en una nueva columna es el SPSS. Sobre estos residuos de deben llevar a cabo una serie de pruebas.
[pic 2] |
- Normalidad: Uno de los principales supuestos para un modelo de regresión es que los residuos sigan una distribución normal. Tanto la prueba de Kolmogorov como la de Shapiro apoyan esta hipótesis. Los p-valores son mayores que 0,05.
Pruebas de normalidad | ||||||
Residuos | Kolmogorov-Smirnov | Shapiro-Wilk | ||||
Estadístico | gl | Sig. | Estadístico | gl | Sig. | |
RES_nivel | ,067 | 75 | ,200* | ,988 | 75 | ,703 |
RES_log | ,083 | 75 | ,200* | ,980 | 75 | ,290 |
- Índice de inflación de varianza: Las siguientes tablas muestran el índice de inflación de la varianza. Para ambas variables en ambos modelos es de 1. Este valor se interpreta como no existencia de multicolinealidad entre las variables explicativas.
Modelo Nivel | Estadísticos de colinealidad | |
Tolerancia | FIV | |
price | ,999 | 1,001 |
advert | ,999 | 1,001 |
Modelo log | Estadísticos de colinealidad | |
Tolerancia | FIV | |
log_price | 1,000 | 1,000 |
log_advert | 1,000 | 1,000 |
- Observaciones influénciales: En las siguientes tablas se muestra la información sobre algunos otros estadísticos que describen los residuos y se sustentan de forma gráfica también.
Estadísticos sobre los residuos | |||||
| Mínimo | Máximo | Media | Desviación típica | N |
Valor pronosticado | 68,5229 | 86,1202 | 77,3747 | 4,34421 | 75 |
Valor pronosticado tip. | -2,038 | 2,013 | ,000 | 1,000 | 75 |
Error típico de valor pronosticado | ,575 | 1,406 | ,954 | ,212 | 75 |
Valor pronosticado corregido | 68,8864 | 86,1294 | 77,3868 | 4,35293 | 75 |
Residual | -13,48246 | 11,30490 | ,00000 | 4,81964 | 75 |
Residuo típ. | -2,759 | 2,314 | ,000 | ,986 | 75 |
Residuo estud. | -2,809 | 2,346 | -,001 | 1,005 | 75 |
Residuo eliminado | -13,96723 | 11,62054 | -,01213 | 5,00599 | 75 |
Residuo eliminado estud. | -2,956 | 2,424 | -,002 | 1,021 | 75 |
Dist. de Mahalanobis | ,038 | 5,145 | 1,973 | 1,281 | 75 |
Distancia de Cook | ,000 | ,095 | ,013 | ,019 | 75 |
Valor de influencia centrado | ,001 | ,070 | ,027 | ,017 | 75 |
...