ANALISIS DE REGRESION LINEAL
diajane12Apuntes1 de Enero de 2019
683 Palabras (3 Páginas)165 Visitas
Capítulo 14 Análisis de regresión lineal
En el capítulo cuatro se estudiará el análisis de correlación para visualizarla desde un punto de vista descriptivo; los diagramas de dispersión y la magnitud del coeficiente de correlación lineal se usaron para determinar si existía una relación lineal entre dos variables, y cuando eso ocurría usamos el análisis de correlación para describirla. La ecuación de regresión lineal se usó para describir la manera en que están relacionadas dos variables. El propósito de este capítulo es estudiar regresión y correlación desde el punto de vista de hacer inferencia usando la estadística desarrollada en el capítulo cuatro.
Sección 14.1 modelo de regresión lineal
La regresión lineal se refiere a la predicción del valor de una variable a partir de una o más variables. En ocasiones se denomina a la variable dependiente variable de respuesta y a la variable independiente variable de predicción.
Ejemplo
Suponga que vemos la colección de ocho pares de datos (cid, mpg) como muestra de una población de pares, donde las medidas cid pueden tomar cualquier valor en el rango de valores que se extiende de 85 a 122. Para cada cid posible hay muchos millajes asociados con ella. Por ejemplo, para un tamaño de motor de 97 cid. Asumamos que existe una relación lineal para la población de pare de datos cid y mpg. Se puede usar el modelo probabilístico siguiente para explicar el comportamiento de los millajes mpg para las ocho (seis distintas) medidas de cid, éste se llama modelo de regresión lineal y expresa la relación lineal entre cid () y mpg ().[pic 1][pic 2]
Modelo de regresión lineal
[pic 3]
El lado derecho de la ecuación contiene una variable aleatoria, la letra griega de épsilon minúscula, que expresa el error aleatorio obtenido al medir en un valor fijo de. Si todos los puntos del diagrama de dispersión de la población cayeran en una recta no habría la necesidad de incluir el termino de error en el modelo, ni de involucrar la probabilidad en nuestro estudio de la relación entre y . En tal caso, para cada valor de , podría determinarse exactamente el modelo lineal resultante se llamaría: modelo determinístico. Los parámetros representarían la – intercepción y la pendiente de la recta respectivamente. La expresión se denomina en ocasiones la componente determinística del modelo de regresión lineal. Nuestra muestra de datos consistente en ocho pares de datos se usará para estimar los parámetros de la componente determinística.[pic 4][pic 5][pic 6][pic 7][pic 8][pic 9][pic 10][pic 11][pic 12][pic 13][pic 14]
La diferencia principal entre un modelo probabilístico y uno determinístico es la inclusión de un terminó de error aleatorio en el modelo probabilístico. Para nuestra muestra de datos, lo apropiado es un modelo probabilístico por que el Mazda 626 y el Toyota Corolla tienen rendimientos de mpg distintos, (29 y 32), para el mimo tamaño de motor, (12 a cid). Los rendimientos de mpg distintos para un mismo tamaño de motor se atribuyen al termino de error en el modelo de regresión. Para cada tamaño de motor, la componente determinística del modelo de regresión es igual a una constante, digamos . Esto es, para un tamaño de motor fijo , la proporción de millas por galón es igual a la constante más un término de error. Es decir.[pic 15][pic 16][pic 17]
[pic 18]
Los valores de varían directamente con los demás términos de error aleatorio. Los términos de y son variables aleatorias. [pic 19][pic 20][pic 21]
Supuestos para el modelo de regresión lineal
- Para cada valor de , la variable aleatorias se distribuye normalmente.[pic 22][pic 23]
- Para cada valor de , la media o valor esperado de es 0; esto es, .[pic 24][pic 25][pic 26]
- Para cada valor de , la varianza de es la constante (llamada varianza del error).[pic 27][pic 28][pic 29]
- Los valores del termino de error son independientes.[pic 30]
Regresemos a la aplicación referente al tamaño del motor y los millajes para los ocho coches compactos modelo 1984 y calculemos la ecuación de regresión. Por conveniencia representamos la ecuación de regresión estimada por . [pic 31]
Nota: en el capítulo cuatro representamos la ecuación de regresión estimada por , con el fin de calcular los valores de y , recordemos las siguientes fórmulas: [pic 32][pic 33][pic 34]
...