Modelos De Regresion Lineal
karenluna14944 de Noviembre de 2014
3.915 Palabras (16 Páginas)416 Visitas
MODELOS DE REGRESION
ADELFA EMILIA ALMEIDA LARA
estudian la relación estocástica cuantitativa entre una variable de interés y un conjunto de variables explicativas
ITSAV
01/09/2014
INGENIERIA EN GESTION EMPRESARIAL
Materia:
ESTADISTICA INFERENCIAL II
Semestre-Grupo:
5° “A”
Producto Académico:
INVESTIGACION
Tema:
MODELOS DE REGRESION LINEAL
Presenta:
ADELFA EMILIA ALMEIDA LARA 126Z0159
Docente:
ING. GABRIELA HERNADEZ CRUZ
H. Y G. ALVARADO, VER. AGOSTO-DICIEMBRE 2014
INTRODUCCIÓN
EN EL SIGUENTE TRABAJO SE ABORDARAN LOS TEMAS DE LA PRIMERA UNIDAD
VENDRA QUE SON LOS MODELOS DE REGRESION QUE SON LOS QUE ESTUDIAN LA RELACIÓN ESTOCÁSTICA CUANTITATIVA ENTRE UNA VARIABLE DE INTERÉS Y UN CONJUNTO DE VARIABLES EXPLICATIVAS.
ÍNDICE
Modelos de regresión simple ………………………………………………………………………………………………………………5
Supuestos……………………………………………………………………………………………..15
Determinación de la ecuación de regresión ……………………………………………………………………………………………….……………20
Medidas de variación cálculos de los coeficientes de correlación y de determinación ……………………………………………………………………………………….22
Análisis residual ……………………………………………………………………………………………………………….24
Inferencias árcades de la pendiente……………………………………………………………………………………………..26
MODELO DE REGRESIÓN SIMPLE
un método matemático que modela la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
: Variable dependiente, explicada o regresando.
: Variables explicativas, independientes o regrosares.
: Parámetros, miden la influencia que las variables explicativas tienen sobre el regresando.
Donde es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
SUPUESTOS
Supuestos básicos del modelo de regresión lineal múltiple Relación entre Y y las X j Existe una relación entre Y y cada X j ; dicha relación es lineal Cualquier otro factor que influya en Y y no esté especificado en el modelo, lo consideramos como parte de un término aleatorio de error, Es decir, hay una relación entre las variables que se puede expresar como 8 21 ene 2011 Esquema General Regresión Lineal Múltiple
Características de las X j Las X j pueden o no ser aleatorias Se miden en escala binaria, ordinal, de intervalo o de razón (si alguna de las X es nominal con m categorías, hay que sustituirla por m-1 variables binarias o indicadoras) Las X j son independientes entre sí. De manera práctica, esto significa que dos X j distintas no miden lo mismo 9 21 ene 2011 Esquema General Regresión Lineal Múltiple
Distribución de los errores, Para cada combinación de valores de las X j, los errores se distribuyen N(0, σ 2 ), en particular, varianza es siempre la misma Los errores son independientes entre sí Los errores son independientes del valor de las X j 10 21 ene 2011 Esquema General Regresión Lineal Múltiple
El que los errores se distribuyan N(0, 2 ) tiene como consecuencia que la variable Y, en cada combinación de valores de las X se distribuya N (X, 2 ) Esto es importante, porque para que tenga sentido la aplicación de un modelo de regresión lineal múltiple, se requiere que la variable Y sea normal, o al menos continua y simétrica 11 21 ene 2011 Esquema General Regresión Lineal Múltiple
Si Y no es continua se requiere: Hacer una transformación a los datos que nos permita considerar que la variable transformada sí es normal Utilizar otros modelos de regresión que no son lineales (por ejemplo, logística), los cuales no veremos por el momento 12 21 ene 2011 Esquema General Regresión Lineal Múltiple
DETERMINACIÓN DE LA ECUACIÓN DE REGRESIÓN
1. ecuación de la recta de regresión permite pronosticar la puntuación que alcanzará cada sujeto en una variable Y conociendo su puntuación en otra variable X. A la variable Y se le denomina criterio y a la variable X predictor.
2. Sin embargo, raramente la nube de puntos que representa la relación entre dos variables X e Y adopta la forma de una línea recta perfecta. En el caso en que exista una relación alta entre las variables, la nube de puntos tiende a parecerse a una recta. Sólo en el caso de rxy=1 la nube de puntos se ajusta perfectamente a la línea recta.
3. Teniendo esto en cuenta, la recta de regresión es la línea recta que mejor se ajusta a la nube de puntos para dos variables X e Y, es decir, la que permitiría minimizar el error medio cometido al hacer los pronósticos como si la nube de puntos tuviera una forma lineal.
4. Por ejemplo: Consideremos un grupo de 4 personas para las que conocemos sus puntuaciones en determinadas variables X e Y, según se muestra en las dos primeras columnas de la siguiente tabla:
X Y Y´ Y´-Y (Y´-Y)2
5
6
7
8 3
2
4
5 2
4
6
8 -1
2
2
3 1
4
4
9
5. A partir de estos valores, y suponiendo que existe una relación lineal entre X e Y, podemos tratar de pronosticar el valor que alcanzará en la variable Y un sujeto, conociendo su puntuación en la variable X.
6. Supongamos que la relación existente entre ambas variables viene determinada por la recta Y = 2X-8. Para comprobar si esta recta permite realizar un buen pronóstico, comprobaremos si los valores que toma Y para los cuatro sujetos (según la recta) coinciden con los que efectivamente hemos observado. Denominamos Y´ a las puntuaciones pronosticadas usando la recta Y = 2X-8.
7. Así observamos que la puntuación pronosticada para el primer sujeto es de 2, mientras que la puntuación real obtenida por dicho sujeto ha sido de 3.Se ha cometido un error en la predicción, que viene determinado por (Y´-Y) (a menudo interesa que el error no aparezca negativo, es decir, nos da igual que sea por exceso o por defecto; una forma de evitar el signo es considerando las diferencias al cuadrado).
8. La diferencia entre las puntuaciones pronosticadas y las observadas en los sujetos se aprecian en la figura 3, que representa el diagrama de dispersión y la ecuación de la recta utilizada para predecir los valores Y´.
[D]
9. Figura 3: Diagrama de dispersión y predicción de la recta Y=2X+8
10. Como hemos podido comprobar, la recta no estima demasiado bien los valores de Y´. Nuestro interés se centrará en encontrar la recta que permita llevar a cabo una estimación de los valores de Y´ con el menor error posible. Esa recta es la que denominaremos recta de regresión de Y sobre X.
11. El criterio que ha de satisfacer esta recta, es que la suma de los errores cuadráticos ( [D]) en la predicción de Y a partir de X sea mínima.
12. La recta de regresión vendrá determinada por una ecuación del tipo: Y´= A+BX.
13. El valor de las constantes A y B puede ser hallado a partir del cálculo diferencial. Presentamos en el siguiente cuadro los valores de A y B en el caso de que trabajemos con puntuaciones directas, diferenciales y típicas, y pretendamos calcular las constantes correspondientes a la recta de regresión de Y sobre X.
ECUACIÓN DE LA RECTA DE REGRESIÓN DE Y SOBRE X
Puntuaciones Directas Puntuaciones Diferenciales Puntuaciones Típicas
Y´=A+BX
A= -B
y´=A+Bx
A=0
A=0
B= rxy
MEDIDAS DE VARIACIÓN
Las medidas de tendencia central (media, moda, mediana ) t tienen como objetivo el sintetizar los datos en un valor
...