ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Regresion lineal. Estadísticas de la regresión

Tamara ReinosoTarea6 de Julio de 2020

1.475 Palabras (6 Páginas)224 Visitas

Página 1 de 6

Set de datos:

• Hamburguesas

• Azúcar

• Datos entrenamiento

I. En un negocio de venta de hamburguesas, se desea explicar las ventas en función del precio promedio de las hamburguesas y los gastos en publicidad.

  1. Corra dos modelos:

• Con todas las variables en nivel

• Con todas las variables en logaritmo natural

• determine la significancia de cada modelo y los coeficientes.

• interprete los coeficientes

Variables en Nivel

[pic 1]

Estadísticas de la regresión

Coeficiente de correlación múltiple

0,669520547

Coeficiente de determinación R^2

0,448257762

R^2  ajustado

0,432931589

Error típico

4,886123971

Observaciones

75

Coeficiente de determinación Rˆ2= 44,83%

Se puede observar que el modelo explica un 44,83% la variabilidad de las ventas de hamburguesas.

Interpretación de Coeficientes;

 

Coeficientes

Intercepción

118,9136104

price

-7,907854327

advert

1,862584271

[pic 2]

[pic 3]

[pic 4]

[pic 5]

[pic 6]

Significancia del modelo y coeficientes:

Prueba de hipótesis:

[pic 7]

[pic 8]

Nivel de significancia del modelo

α = 0,05  ; P-value < 0,05 se rechaza la hipótesis nula.

Se concluye que el modelo es globalmente significativo.

Nivel de significancia de los coeficientes

[pic 9]

 

[pic 10]

Variables en logaritmo natural

[pic 11]

Estadísticas de la regresión

Coeficiente de correlación múltiple

0,68491276

Coeficiente de determinación R^2

0,46910549

R^2  ajustado

0,45435842

Error típico

0,06237373

Observaciones

75

Coeficiente de determinación Rˆ2= 46,91%

Se puede observar que el modelo explica un 46,91% la variabilidad de las ventas de hamburguesas

Interpretación de Coeficientes;

 

Coeficientes

Intercepción

5,319948693

LN price

-0,574936031

LN advert

0,045440361

[pic 12]

[pic 13]

[pic 14]

[pic 15]

[pic 16]

Significancia del modelo y coeficientes:

Prueba de hipótesis:

[pic 17]

[pic 18]

Nivel de significancia del modelo

α = 0,05  ; P-value < 0,05 se rechaza la hipótesis nula.

Se concluye que el modelo es globalmente significativo.

Nivel de significancia de los coeficientes

[pic 19]

[pic 20]

  1. Realice un diagnóstico completo de cada regresión incluyendo:

Nivel-Nivel

• Gráfico de residuales

[pic 21]

[pic 22]

Al observar la distribución de los residuos se detectó que existe alguna tendencia o patrón definido, indicativo de la  existencia de correlación entre los errores y por tanto el supuesto de dependencia se cumple, existe distribución normal.

• Normalidad de los residuales.

Si el valor es > 0,05 significa que el error se distribuye normal.

Se obtiene siguiente tabla

[pic 23]

Lo que significa que para este modelo el error si se distribuye normal.

Factor de correlación normalidad:  exp (promedio de los cuadrados residuales / 2)

 

Grados de libertad

Suma de cuadrados

Promedio de los cuadrados

Regresión

2

0.23315863

0.116579315

Residuos

72

0.294469278

0.004089851

Total

74

0.527627908

 

Factor de corrección: 1.002047018

Factor de corrección no normal:

 

Coeficientes

Intercepción

0

Y est

1.001950172

        

• VIF

R^2

VIF

advert

0.094201

1.103998

price

0.420038

1.724250

A partir de los resultados se puede concluir que la regresión no presenta multicolinealidad pues los Vif de las variables son menores a 10, se puede notar que el valor máximo del Vif toma un valor de 1,724.

• Observaciones influyentes (residuales estudentizados, leverage values, DFFITS, DFBETAS, COOK's distance, Covratio)

Observaciones influyentes;

Residuales estudentizados: podemos observar que no existe ningún dato mayor a 3 por tanto no existen observaciones influyentes.

[pic 24]

Leverage values: (2*(3+1)/75)=0,10 no existe observaciones mayores al valor indicado, por tanto no hay observaciones influyente.

[pic 25]

DFFITS: (2* ) Existe un observación mayor que 0.4618 por lo cual se considera influyente[pic 26]

[pic 27]

DFBETAS: ( 2:) si existen observaciones influyentes mayores a este valor absoluto[pic 28]

[pic 29]

[pic 30]

COOK's distance: (4:75=0.053) Existe 3 observaciones influyentes.

[pic 31]

Covratio: (1 +- 3*4/75= -0,84 - 1.16) no existen observaciones influyentes, ya que no hay datos fuera del rango indicado.

[pic 32]

• Interprete los resultados.

Podemos concluir que existen 7 observaciones influyentes considerando los parámetros anteriores, y una observación que se repite en tres criterios.

Esto significa que estas observaciones se encuentran muy alejadas del valor previsto lo que es probable que en esos valores se esté teniendo casos desviados o medidas erróneas.

Variables en logaritmo natural

• Gráfico de residuales

[pic 33]

[pic 34]

Al observar la distribución de los residuos ambos gráficos tienden la misma distribución de las varianza de residuos, se  visualiza que existe alguna tendencia o patrón definido, indicativo de la  existencia de correlación entre los errores y por tanto el supuesto de dependencia se cumple, existe distribución normal.

...

Descargar como (para miembros actualizados) txt (12 Kb) pdf (934 Kb) docx (1 Mb)
Leer 5 páginas más »
Disponible sólo en Clubensayos.com