Unidad II Regresion Lineal Multiple Y Correlacion
anaflorees21 de Noviembre de 2013
680 Palabras (3 Páginas)4.186 Visitas
2.1 Modelo de Regresión Múltiple
El objetivo del análisis de la regresión lineal es analizar un modelo que pretende explicar el comportamiento de una variable (Variable endógena, explicada o dependiente), que denotaremos por Y, utilizando la información proporcionada por los valores tomados por un conjunto de variables (explicativas, exógenas o independientes), que denotaremos por X1 , X2 , ....., X n
2.2 Estimación de la Ecuación de Regresión Múltiple
Para i = 1,2,….n. Escribiendo el modelo para cada una de las observaciones, éste puede ser considerado como un sistema de ecuaciones lineales de la forma
2.3 Matriz de Varianza-Covarianza.
Cuando en un estudio se mide la relación variada entre más de dos variables, frecuentemente la información se expresa en forma matricial. La estructura de esta matriz, de naturaleza simétrica, y conocida como matriz de varianzas/covarianzas es la siguiente:
X1 X2 X3
X1 S2x1 Sx1.x2 Sx1.x3
X2 Sx2.x1 S2x2 Sx2.x3
X3 Sx3.x1 Sx3.x2 S2x3
2.4 Pruebas de Hipótesis para los Coeficientes de Regresión.
H0 : = 0 (equivale a plantear que no hay relación entre Y y Xi )
H1 : 0 (equivale a plantear que sí hay relación entre Y y Xi )
Si se acepta la de hipótesis nula, se está aceptando que no hay relación entre Y y Xi , por lo tanto, ésta variable se debe sacar del modelo.
La estadística de trabajo se resuelve suponiendo que la hipótesis nula (H0 ) es verdadera. Dicha estadistica de trabajo es:
Regla de decisión . Si el número de observaciones es mayor que 30, los valores de Z se hallan en la distribución normal. Si el número de observaciones es menor o igual a 30 , los valores de Z se hallan en la distribución t con n-k-1 grados de libertad. Siendo k el número de variables independientes en el modelo.
2.5 Correlación Lineal Múltiple
Si el modelo que se ajusta es un modelo de regresión lineal múltiple, a R se le denomina coeficiente de correlación múltiple y representa el porcentaje de variabilidad de la Y que explica el modelo de regresión.
Como scE < scG, se verifica que 0 < R2 < 1. Si R2 = 1 la relación lineal es exacta y si R2 = 0 no existe relación lineal entre la variable respuesta y las variables regresoras.
El coeficiente de correlación múltiple R es igual al coeficiente de correlación lineal simple entre el vector variable respuesta y el vector de predicciones ,
El coeficiente de correlación múltiple R presenta el inconveniente de aumentar siempre que aumenta el número de variables regresoras, ya que al aumentar k (número de variables regresoras) disminuye la variabilidad no explicada, algunas veces de forma artificial lo que puede ocasionar problemas de multicolinealidad. Si el número de observaciones n es pequeño, el coeficiente R2 es muy sensible a los valores de n y k. En particular, si n = k + 1 el modelo se ajusta exactamente a las observaciones. Por ello y con el fin de penalizar el número de variables regresoras que se incluyen en el modelo de regresión, es conveniente utilizar el coeficiente de determinación corregido por el número de grados de libertad, 2. Este coeficiente es similar al anterior, pero utiliza el cociente de varianzas en lugar del cociente de sumas de cuadrados. Para su definición se tiene en cuenta que
Conclusión
El modelo de regresión lineal múltiple requiere que se satisfagan básicamente los mismos supuestos que el modelo de regresión lineal simple. Como se planteó en el primer artículo de esta serie, tales supuestos deben ser verificados en cada situación
...