Detección de supuestos
MAGDALENA NAVARRO DIAZApuntes10 de Julio de 2025
638 Palabras (3 Páginas)41 Visitas
Detección de supuestos
Linealidad
Media de los residuos = 2.456368e-17 es igual a 0 (muy cercano)
En este gráfico, los residuos se encuentran dispersos aleatoriamente alrededor de la línea cero, sin mostrar patrones sistemáticos. Esto indica que el modelo cumple con el supuesto de linealidad, es decir, la relación entre las variables independientes y la variable dependiente puede modelarse adecuadamente mediante una función lineal.
Normalidad
Shapiro Wilks n < 50 datos
Kolmogorov– Smirnov (KS) n > 50 datos
Jarque – Bera n >= 100
Ho: Los residuos distribuyen normalmente
H1: Los residuos no distribuyen normalmente
Si P-value > 0,05 NRH0
Shapiro no se ocupa porque n>100 datos
kolmogorov
Como el p-value (0,6567) es mayor al nivel de significancia, por ejemplo, al 0,05, NRHo, es decir, los residuos distribuyen estadísticamente normales.
Jarque
Como el p-value (0,2679) es mayor al nivel de significancia, por ejemplo al 0,05, NRHo, es decir, los residuos distribuyen estadísticamente normales.
En el gráfico Q-Q, los puntos se alinean muy cerca de la línea diagonal, lo que indica que los residuos del modelo se distribuyen aproximadamente de manera normal. Esto valida el supuesto de normalidad y sugiere que los intervalos y pruebas de hipótesis basados en el modelo son confiables.
Independencia
Ho: No existe presencia de autocorrelación.
H1: Existe presencia autocorrelación.
Durbin-Watson
El p-value (0,1989) es mayor a 0,05, por lo que No rechazo H0 de ausencia de autocorrelación en los residuos. Los residuos son estadísticamente independientes.
El gráfico de residuos ordenados muestra que los residuos están dispersos aleatoriamente alrededor de la línea cero, sin patrones visibles. Esto sugiere que el supuesto de independencia se cumple y que no hay autocorrelación en los errores.
Heterocedasticidad
Ho: Residuos Homocedásticos
H1: Residuos Heterocedásticos.
White Goldelf - Quandt
Cuando el test Goldfeld-Quandt te da un p-valor alto, en este caso 0.4531 (mayor a 0.05), significa que no hay evidencia para rechazar la homocedasticidad. O sea, que la varianza de los errores es constante y no hay heterocedasticidad. (se cumple la homocedasticidad)
Multicolinealidad
Ho: No existe Multicolinealidad
H1: Existe presencia de Multicolinealidad
Matriz de correlación: La correlación entre x1 y x2 es -0,049, que es muy cercana a cero.
Esto indica que no hay correlación lineal relevante entre ambas variables.
VIF= 1.002459 <10
En este caso el FIV es menor a 10, por lo tanto no tenemos evidencia de presencia de multicolinealidad.
Luis Oteiza
#Ayudantía Econometria
#Luis Oteiza
# 1. Cargar librerías (si no están instaladas, usar install.packages("ggplot2"))
library(ggplot2)
# 2. Simular datos
set.seed(123)
n <- 100
x1 <- rnorm(n, mean = 50, sd = 10)
x2 <- rnorm(n, mean = 30, sd = 5)
error <- rnorm(n, mean = 0, sd = 5)
# Supongamos que Y depende más de x1 que de x2
Y <- 2 + 0.8 * x1 + 0.2 * x2 + error
# 3. Crear dataframe
data <- data.frame(Y, x1, x2)
# 4. Primer modelo: Y ~ x1
modelo1 <- lm(Y ~ x1, data = data)
summary(modelo1)
# 5. Segundo modelo: Y ~ x2
modelo2 <- lm(Y ~ x2, data = data)
...