Regresión lineal. Determinar los residuales
Daniel Muñoz CastroTarea23 de Noviembre de 2018
4.529 Palabras (19 Páginas)240 Visitas
Ejercicio 1
[pic 1]
Fig. 1.1 Datos del problema
- Determinar los coeficientes y de la regresión lineal.[pic 2][pic 3]
Después de definir los vectores de los datos procedemos a graficar la dispersión de los datos por medio de la función “scatter” para así obtener los coeficientes y (fig. 1.2).[pic 4][pic 5]
[pic 6]
Fig. 1.2 Dispersión de los datos y coeficientes de la regresión lineal
- Determinar los residuales
Utilizando el obtenido anteriormente procedemos a determinar los residuales.[pic 7]
[pic 8]
Obteniendo los siguientes valores (Fig. 1.3):
[pic 9]
Fig. 1.3 Valores residuales.
- Determinar SSE y varianza estimada.
Para determinar los factores SSE y la varianza utilizamos las formulas vistas en clase, quedando de esta manera.
[pic 10]
Obteniendo:
[pic 11][pic 12]
- Determinar el error estándar de los coeficientes y [pic 13][pic 14]
Inicialmente para poder determinar los errores estándares de los coeficientes beta necesitamos generar el modelo de regresión lineal con ayuda del comando “fitlm” a continuación generamos una matriz de coeficientes de covarianza con el comando mdl.CoefficientCovariance y por ultimo generamos los valores de los errores estándar generando la diagonal de la raíz cuadrada de nuestra matriz de coeficientes de covarianza.
[pic 15]
Generando un vector 2x1 el cual el elemento del primer renglón indicará el error estándar para y a su vez el elemento siguiente será el correspondiente a [pic 16][pic 17]
[pic 18]
- Demuestra que [pic 19]
- Determine el coeficiente de determinación, [pic 20]
Para calcular el coeficiente hacemos uso del comando “fitlm” de nuestros datos lo cual nos proporcionara un grupo de datos [pic 21]
[pic 22]
Debido a que nuestro valor = 0.986 se puede determinar que el modelo es exitoso para explicar la variabilidad de la respuesta.[pic 23]
- Realizar la prueba T
Procedemos a relaizar la prueba t con ayuda del comando “ttest” obteniendo los siguientes datos.
[pic 24]
[pic 25]
Obteniendo un valor de H=1 podemos determinar que se rechaza la hipótesis nula para este ejercicio y además en conjunto con el valor p cercano a cero determinamos que el coeficiente es representativo dentro de nuestra regresión lineal.[pic 26]
- Construye la tabla ANOVA
Utilizamos el comando “anova1” para así obtener la tabla ANOVA.
[pic 27]
[pic 28]
Al obtener un valor diferente de 0 para la columna Prob>F podemos determinar que la hipótesis de la regresión lineal es adecuada. En relación con los valores obtenidos en el inciso G) podemos determinar que la regresión es acertada.
- Construir un intervalo de confianza para un 95% en [pic 29]
[pic 30]
Figura 1.4 Datos graficados en un intervalo de confianza del 95%
De acuerdo con lo que se aprecia en la figura 1.4 podemos apreciar que todos los datos del problema se encuentran compactados dentro del intervalo de confianza del 95% por lo cual se concluye finalmente que la regresión lineal de los datos es correcta y que estos se encuentran con un alto nivel de confianza.
- A la aproximación generada inicialmente se le cumple con el valor de R2, prueba T, análisis ANOVA y a su vez cumple con el intervalo de confianza compacto del 95%, por lo tanto para este ejercicio para este ejercicio el método de regresión lineal es acertado.
Ejercicio 2
[pic 31]
Fig. 2.1 Datos del problema
- Determinar los coeficientes y de la regresión lineal.[pic 32][pic 33]
Después de definir los vectores de los datos procedemos a graficar la dispersión de los datos por medio de la función “scatter” para así obtener los coeficientes y (fig. 2.2).[pic 34][pic 35]
[pic 36]
Fig. 2.2 Dispersión de los datos y coeficientes de la regresión lineal
- Determinar los residuales
Utilizando el obtenido anteriormente, le restamos 1 y procedemos a determinar los residuales.[pic 37]
[pic 38]
Obteniendo los siguientes valores (Fig. 2.3):
[pic 39]
Fig. 2.3 Valores residuales.
- Determinar SSE y varianza estimada.
Para determinar los factores SSE y la varianza utilizamos las fórmulas vistas en clase, quedando de esta manera.
[pic 40]
Obteniendo:
[pic 41] [pic 42]
- Determinar el error estándar de los coeficientes y [pic 43][pic 44]
Inicialmente para poder determinar los errores estándares de los coeficientes beta necesitamos generar el modelo de regresión lineal con ayuda del comando “fitlm” a continuación generamos una matriz de coeficientes de covarianza con el comando mdl.CoefficientCovariance y por ultimo generamos los valores de los errores estándar generando la diagonal de la raíz cuadrada de nuestra matriz de coeficientes de covarianza.
[pic 45]
Generando un vector 2x1 el cual el elemento del primer renglón indicará el error estándar para y a su vez el elemento siguiente será el correspondiente a [pic 46][pic 47]
[pic 48]
- Demuestra que [pic 49]
- Determine el coeficiente de determinación, [pic 50]
Para calcular el coeficiente hacemos uso del comando “fitlm” de nuestros datos lo cual nos proporcionara un grupo de datos [pic 51]
[pic 52]
Debido a que nuestro valor = 0.998 se puede determinar que el modelo es exitoso para explicar la variabilidad de la respuesta.[pic 53]
- Realizar la prueba T
Procedemos a realizar la prueba t con ayuda del comando “ttest” obteniendo los siguientes datos.
[pic 54]
[pic 55]
Obteniendo un valor de H=1 podemos determinar que se rechaza la hipótesis nula para este ejercicio y además en conjunto con el valor p cercano a cero determinamos que el coeficiente es representativo dentro de nuestra regresión lineal.[pic 56]
- Construye la tabla ANOVA
Utilizamos el comando “anova1” para así obtener la tabla ANOVA.
[pic 57]
[pic 58]
Al obtener un valor diferente de 0 para la columna Prob>F podemos determinar que la hipótesis de la regresión lineal es adecuada. En relación con los valores obtenidos en el inciso G) podemos determinar que la regresión es acertada.
- Construir un intervalo de confianza para un 95% en [pic 59]
[pic 60]
Figura 2.4 Datos graficados en un intervalo de confianza del 95%
De acuerdo con lo que se aprecia en la figura 2.4 podemos apreciar que todos los datos del problema se encuentran compactados dentro del intervalo de confianza del 95%,aunque existe un elemento en los limites del intervalo aun se considera que se encuentra dentro de los lineamientos, por lo cual se concluye finalmente que la regresión lineal de los datos es correcta y que estos se encuentran con un alto nivel de confianza.
- A la aproximación generada inicialmente se le cumple con el valor de R2, prueba T, análisis ANOVA y a su vez cumple con el intervalo de confianza compacto del 95%, por lo tanto, para este ejercicio para este ejercicio el método de regresión lineal es acertado.
Ejercicio 3
[pic 61]
Fig. 3.1 Datos del problema
- Determinar los coeficientes y de la regresión lineal.[pic 62][pic 63]
Después de definir los vectores de los datos procedemos a graficar la dispersión de los datos por medio de la función “scatter” para así obtener los coeficientes y (fig. 3.2).[pic 64][pic 65]
[pic 66]
Fig. 3.2 Dispersión de los datos y coeficientes de la regresión lineal
Desde este punto se puede apreciar que la distribución presenta anomalías.
- Determinar los residuales
Utilizando el obtenido anteriormente0 y procedemos a determinar los residuales.[pic 67]
[pic 68]
Obteniendo los siguientes valores (Fig. 3.3):
...