Intervalos de confianza del 95.0% para las estimaciones de los coeficientes
kachorro23Ensayo23 de Agosto de 2016
1.725 Palabras (7 Páginas)769 Visitas
INSTITUTO TECNOLÓGICO DE CAMPECHE[pic 1][pic 2]
LA TÉCNICA EN PROVINCIA ENGRANDECE A LA NACIÓN
INGENIERÍA INDUSTRIAL.
Unidad I (2 parte).-Regresión lineal multiple.
Tarea 2
Nombre del alumno:
Juan David Reyes Hernández.
Materia:
Estadística inferencial II.
Grupo:
VI-4
Fecha:
__/marzo/2015
Contenido
Introducción:
Unidad V (1 parte).- Regresión lineal simple.
Regresión Múltiple - Horsepower
Análisis de Varianza
ANOVA adicional para Variables en el Orden Ajustado
Intervalos de confianza del 95.0% para las estimaciones de los coeficientes
Matriz de Correlación para las estimaciones de los coeficientes
Residuos Atípicos
Prueba de hipótesis para a regresión lineal múltiple.
Pruebas de bondad de ajuste.
Ajuste de Datos No Censurados – RESIDUOS
Graficas:
La Grafica De Regresión Lineal
Grafica De Normalidad
Grafica De Residuos.
Conclusión final.
Bibliografía:
Introducción:
Anteriormente se ha estudiado el modelo de regresión lineal simple, donde se analizaba la influencia de una variable independiente X en los valores que toma otra variable denominada dependiente (Y).
En la regresión lineal múltiple vamos a utilizar más de una variable independiente; esto nos va a ofrecer la ventaja de utilizar más información en la construcción del modelo y, consecuentemente, realizar estimaciones más precisas.
Unidad V (1 parte).- Regresión lineal simple.
Competencias específicas a desarrollar:
- Identificar y aplicar los conceptos básicos del modelo de regresión lineal simple.
- Establecer las condiciones para distinguir entra una regresión y una correlación.
Regresión Múltiple - Horsepower
Variable dependiente: Horsepower (maximum)
Variables independientes: Fueltank (gallons), Cylinders, RPM (revs per minute at maximum horsepower)
Error | Estadístico | |||
Parámetro | Estimación | Estándar | T | Valor-P |
CONSTANTE | -273.032 | 31.3089 | -8.7206 | 0.0000 |
Fueltank | 5.77144 | 1.03629 | 5.56934 | 0.0000 |
Cylinders | 27.3058 | 2.63908 | 10.3467 | 0.0000 |
RPM | 0.0349403 | 0.0044937 | 7.77539 | 0.0000 |
Análisis de Varianza
Fuente | Suma de Cuadrados | Gl | Cuadrado Medio | Razón-F |
Modelo | 193913. | 3 | 64637.8 | 123.77 |
Residuo | 45956.2 | 88 | 522.23 | |
Total (Corr.) | 239870. | 91 |
Valor-P |
0.0000 |
R-cuadrada = 80.8412 porciento
R-cuadrado (ajustado para g.l.) = 80.188 porciento
Error estándar del est. = 22.8523
Error absoluto medio = 16.74
Estadístico Durbin-Watson = 2.39129 (P=0.9679)
Autocorrelación de residuos en retraso 1 = -0.202274
La salida muestra los resultados de ajustar un modelo de regresión lineal múltiple para describir la relación entre Horsepower y 3 variables independientes. La ecuación del modelo ajustado es
Horsepower = -273.032 + 5.77144*Fueltank + 27.3058*Cylinders + 0.0349403*RPM
Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una relación estadísticamente significativa entre las variables con un nivel de confianza del 95.0%.
El estadístico R-Cuadrada indica que el modelo así ajustado explica 80.8412% de la variabilidad en Horsepower. El estadístico R-Cuadrada ajustada, que es más apropiada para comparar modelos con diferente número de variables independientes, es 80.188%. El error estándar del estimado muestra que la desviación estándar de los residuos es 22.8523. El error absoluto medio (MAE) de 16.74 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) examina los residuos para determinar si hay alguna correlación significativa basada en el orden en el que se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0.05, no hay indicación de una autocorrelación serial en los residuos con un nivel de confianza del 95.0%.
Para determinar si el modelo puede simplificarse, note que el valor-P más alto de las variables independientes es 0.0000, que corresponde a Fueltank. Puesto que el valor-P es menor que 0.05, ese término es estadísticamente significativo con un nivel de confianza del 95.0%. Consecuentemente, probablemente no quisiera eliminar ninguna variable del modelo.
ANOVA adicional para Variables en el Orden Ajustado
Fuente | Suma de Cuadrados | Gl | Cuadrado Medio | Razón-F | Valor-P |
Fueltank | 120852. | 1 | 120852. | 231.42 | 0.0000 |
Cylinders | 41489.2 | 1 | 41489.2 | 79.45 | 0.0000 |
RPM | 31572.3 | 1 | 31572.3 | 60.46 | 0.0000 |
Modelo | 193913. | 3 |
El StatAdvisor
Esta tabla muestra la significancia estadística de cada variable conforme fue agregada al modelo. Puede utilizar esta tabla para ayudarse a determinar si el modelo puede ser simplificado, especialmente si se está ajustando un polinomio.
*en primera instancia se puede notar que la correlación es de 80% en comparación con la regresión lineal simple de la unidad pasada el aumento de la correlación al agregar dos variables de más de 20%, el estadístico Durbin-Watson muestra que existe correlación en las variables, pero no podemos concluir con solo un nivel alto de correlación.
Intervalos de confianza del 95.0% para las estimaciones de los coeficientes
Error | ||||
Parámetro | Estimación | Estándar | Límite Inferior | Límite Superior |
CONSTANTE | -273.032 | 31.3089 | -335.253 | -210.812 |
Fueltank | 5.77144 | 1.03629 | 3.71203 | 7.83084 |
Cylinders | 27.3058 | 2.63908 | 22.0612 | 32.5505 |
RPM | 0.0349403 | 0.0044937 | 0.02601 | 0.0438706 |
El StatAdvisor
Esta tabla muestra intervalos de confianza del 95.0% para los coeficientes en el modelo. Los intervalos de confianza muestran con qué precisión pueden estimarse los coeficientes dados la cantidad de datos disponibles, y el nivel de ruido que está presente.
Matriz de Correlación para las estimaciones de los coeficientes
CONSTANTE | Fueltank | Cylinders | RPM | |
CONSTANTE | 1.0000 | -0.3792 | -0.2183 | -0.9181 |
Fueltank | -0.3792 | 1.0000 | -0.6524 | 0.1348 |
Cylinders | -0.2183 | -0.6524 | 1.0000 | 0.2099 |
RPM | -0.9181 | 0.1348 | 0.2099 | 1.0000 |
...