ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Diagnóstico de regresión, selección de modelos y regresión con variables Binarias

mantagua12010Tarea12 de Julio de 2020

1.449 Palabras (6 Páginas)155 Visitas

Página 1 de 6

Taller 5. Diagnóstico de regresión, selección de modelos y regresión con variables Binarias

Datos: Hamburguesas

[pic 1]

Primera parte. En un negocio de venta de hamburguesas, se desea explicar las ventas en función del precio promedio de las hamburguesas y los gastos en publicidad.

  1. Corrida de modelos

Modelo con variables de nivel

Resumen del modelo

Modelo

R

R cuadrado

R cuadrado corregida

Error típ. de la estimación

Durbin-Watson

1

,670a

,448

,433

4,88612

2,183

El valor del coeficiente de determinación es 0,448, lo que dice que el 44,8% de la variabilidad de las ventas se ve explicada por el precio y los gastos en publicidad.

ANOVA

Modelo

Suma de cuadrados

gl

Media cuadrática

F

Sig.

Regresión

1396,539

2

698,269

29,248

0

Residual

1718,943

72

23,874

Total

3115,482

74

 

 

 

La tabla de análisis de varianza muestra un p-valor de 0,000 lo que dice que al menos una de las variables es significativa.

Coeficientes

Modelo

Coeficientes no estandarizados

Coeficientes tipificados

t

Sig.

Intervalo de confianza de 95,0% para B

B

Error típ.

Beta

Límite inferior

Límite superior

(Constante)

118,914

6,352

18,722

,000

106,252

131,575

price

-7,908

1,096

-,632

-7,215

,000

-10,093

-5,723

advert

1,863

,683

,239

2,726

,008

,501

3,225

Ahora, por un aumento de una unidad en el precio las ventas caen en 7,908 unidades. Y por otra parte, un aumento de una unidad en publicidad hace que las ventas aumenten en 1,863 unidades.

Modelo con los logaritmos naturales

Resumen del modelo

Modelo

R

R cuadrado

R cuadrado corregida

Error típ. de la estimación

Durbin-Watson

1

,685a

,469

,454

,02709

2,146

Este modelo presenta un coeficiente de determinación de 0,469 siendo más alto que el modelo con las variables en nivel.

ANOVA

Modelo

Suma de cuadrados

gl

Media cuadrática

F

Sig.

Regresión

,047

2

,023

31,810

,000b

Residual

,053

72

,001

Total

,100

74

 

 

 

En este modelo también se aprecia un valor significativo de la prueba F lo cual indica que al menos una de las variables es significativa para explicar el log de las ventas.

Coeficientes

Modelo

Coeficientes no estandarizados

Coeficientes tipificados

t

Sig.

Intervalo de confianza de 95,0% para B

B

Error típ.

Beta

Límite inferior

Límite superior

(Constante)

2,310

,060

38,564

,000

2,191

2,430

log_price

-,575

,079

-,622

-7,246

,000

-,733

-,417

log_advert

,045

,014

,286

3,327

,001

,018

,073

Ambos p-valores son significativos es decir menos a 0,05.

  1. Realice un diagnóstico completo de cada regresión incluyendo:
  • Análisis de residuos: Los residuos se cargan en una nueva columna es el SPSS. Sobre estos residuos de deben llevar a cabo una serie de pruebas.

[pic 2]

  • Normalidad: Uno de los principales supuestos para un modelo de regresión es que los residuos sigan una distribución normal. Tanto la prueba de Kolmogorov como la de Shapiro apoyan esta hipótesis. Los p-valores son mayores que 0,05.

Pruebas de normalidad

Residuos

Kolmogorov-Smirnov

Shapiro-Wilk

Estadístico

gl

Sig.

Estadístico

gl

Sig.

RES_nivel

,067

75

,200*

,988

75

,703

RES_log

,083

75

,200*

,980

75

,290

  • Índice de inflación de varianza: Las siguientes tablas muestran el índice de inflación de la varianza. Para ambas variables en ambos modelos es de 1. Este valor se interpreta como no existencia de multicolinealidad entre las variables explicativas.

Modelo Nivel

Estadísticos de colinealidad

Tolerancia

FIV

price

,999

1,001

advert

,999

1,001

Modelo log

Estadísticos de colinealidad

Tolerancia

FIV

log_price

1,000

1,000

log_advert

1,000

1,000

  • Observaciones influénciales: En las siguientes tablas se muestra la información sobre algunos otros estadísticos que describen los residuos y se sustentan de forma gráfica también.

Estadísticos sobre los residuos

 

Mínimo

Máximo

Media

Desviación típica

N

Valor pronosticado

68,5229

86,1202

77,3747

4,34421

75

Valor pronosticado tip.

-2,038

2,013

,000

1,000

75

Error típico de valor pronosticado

,575

1,406

,954

,212

75

Valor pronosticado corregido

68,8864

86,1294

77,3868

4,35293

75

Residual

-13,48246

11,30490

,00000

4,81964

75

Residuo típ.

-2,759

2,314

,000

,986

75

Residuo estud.

-2,809

2,346

-,001

1,005

75

Residuo eliminado

-13,96723

11,62054

-,01213

5,00599

75

Residuo eliminado estud.

-2,956

2,424

-,002

1,021

75

Dist. de Mahalanobis

,038

5,145

1,973

1,281

75

Distancia de Cook

,000

,095

,013

,019

75

Valor de influencia centrado

,001

,070

,027

,017

75

...

Descargar como (para miembros actualizados) txt (22 Kb) pdf (318 Kb) docx (632 Kb)
Leer 5 páginas más »
Disponible sólo en Clubensayos.com