Regresion lineal. Estadísticas de la regresión
Tamara ReinosoTarea6 de Julio de 2020
1.475 Palabras (6 Páginas)224 Visitas
Set de datos:
• Hamburguesas
• Azúcar
• Datos entrenamiento
I. En un negocio de venta de hamburguesas, se desea explicar las ventas en función del precio promedio de las hamburguesas y los gastos en publicidad.
- Corra dos modelos:
• Con todas las variables en nivel
• Con todas las variables en logaritmo natural
• determine la significancia de cada modelo y los coeficientes.
• interprete los coeficientes
Variables en Nivel
[pic 1]
Estadísticas de la regresión | |
Coeficiente de correlación múltiple | 0,669520547 |
Coeficiente de determinación R^2 | 0,448257762 |
R^2 ajustado | 0,432931589 |
Error típico | 4,886123971 |
Observaciones | 75 |
Coeficiente de determinación Rˆ2= 44,83%
Se puede observar que el modelo explica un 44,83% la variabilidad de las ventas de hamburguesas.
Interpretación de Coeficientes;
| Coeficientes |
Intercepción | 118,9136104 |
price | -7,907854327 |
advert | 1,862584271 |
[pic 2]
[pic 3]
[pic 4]
[pic 5]
[pic 6]
Significancia del modelo y coeficientes:
Prueba de hipótesis:
[pic 7]
[pic 8]
Nivel de significancia del modelo
α = 0,05 ; P-value < 0,05 se rechaza la hipótesis nula.
Se concluye que el modelo es globalmente significativo.
Nivel de significancia de los coeficientes
[pic 9]
[pic 10]
Variables en logaritmo natural
[pic 11]
Estadísticas de la regresión | |
Coeficiente de correlación múltiple | 0,68491276 |
Coeficiente de determinación R^2 | 0,46910549 |
R^2 ajustado | 0,45435842 |
Error típico | 0,06237373 |
Observaciones | 75 |
Coeficiente de determinación Rˆ2= 46,91%
Se puede observar que el modelo explica un 46,91% la variabilidad de las ventas de hamburguesas
Interpretación de Coeficientes;
| Coeficientes |
Intercepción | 5,319948693 |
LN price | -0,574936031 |
LN advert | 0,045440361 |
[pic 12]
[pic 13]
[pic 14]
[pic 15]
[pic 16]
Significancia del modelo y coeficientes:
Prueba de hipótesis:
[pic 17]
[pic 18]
Nivel de significancia del modelo
α = 0,05 ; P-value < 0,05 se rechaza la hipótesis nula.
Se concluye que el modelo es globalmente significativo.
Nivel de significancia de los coeficientes
[pic 19]
[pic 20]
- Realice un diagnóstico completo de cada regresión incluyendo:
Nivel-Nivel
• Gráfico de residuales
[pic 21]
[pic 22]
Al observar la distribución de los residuos se detectó que existe alguna tendencia o patrón definido, indicativo de la existencia de correlación entre los errores y por tanto el supuesto de dependencia se cumple, existe distribución normal.
• Normalidad de los residuales.
Si el valor es > 0,05 significa que el error se distribuye normal.
Se obtiene siguiente tabla
[pic 23]
Lo que significa que para este modelo el error si se distribuye normal.
Factor de correlación normalidad: exp (promedio de los cuadrados residuales / 2)
| Grados de libertad | Suma de cuadrados | Promedio de los cuadrados |
Regresión | 2 | 0.23315863 | 0.116579315 |
Residuos | 72 | 0.294469278 | 0.004089851 |
Total | 74 | 0.527627908 |
|
Factor de corrección: 1.002047018
Factor de corrección no normal:
| Coeficientes |
Intercepción | 0 |
Y est | 1.001950172 |
• VIF
R^2 | VIF | ||
advert | 0.094201 | 1.103998 | |
price | 0.420038 | 1.724250 |
A partir de los resultados se puede concluir que la regresión no presenta multicolinealidad pues los Vif de las variables son menores a 10, se puede notar que el valor máximo del Vif toma un valor de 1,724.
• Observaciones influyentes (residuales estudentizados, leverage values, DFFITS, DFBETAS, COOK's distance, Covratio)
Observaciones influyentes;
Residuales estudentizados: podemos observar que no existe ningún dato mayor a 3 por tanto no existen observaciones influyentes.
[pic 24]
Leverage values: (2*(3+1)/75)=0,10 no existe observaciones mayores al valor indicado, por tanto no hay observaciones influyente.
[pic 25]
DFFITS: (2* ) Existe un observación mayor que 0.4618 por lo cual se considera influyente[pic 26]
[pic 27]
DFBETAS: ( 2:) si existen observaciones influyentes mayores a este valor absoluto[pic 28]
[pic 29]
[pic 30]
COOK's distance: (4:75=0.053) Existe 3 observaciones influyentes.
[pic 31]
Covratio: (1 +- 3*4/75= -0,84 - 1.16) no existen observaciones influyentes, ya que no hay datos fuera del rango indicado.
[pic 32]
• Interprete los resultados.
Podemos concluir que existen 7 observaciones influyentes considerando los parámetros anteriores, y una observación que se repite en tres criterios.
Esto significa que estas observaciones se encuentran muy alejadas del valor previsto lo que es probable que en esos valores se esté teniendo casos desviados o medidas erróneas.
Variables en logaritmo natural
• Gráfico de residuales
[pic 33]
[pic 34]
Al observar la distribución de los residuos ambos gráficos tienden la misma distribución de las varianza de residuos, se visualiza que existe alguna tendencia o patrón definido, indicativo de la existencia de correlación entre los errores y por tanto el supuesto de dependencia se cumple, existe distribución normal.
...