PROBLEMAS DE REGRESION LINEAL SIMPLE
karina_mp17 de Octubre de 2011
4.486 Palabras (18 Páginas)6.334 Visitas
6. En una etapa inicial de procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16
32
48
64
80
96
112
128
144
160
176
192
208
224
240
256
272
288
304
320 26.2
25.7
26.0
27.7
28.3
29.5
30.1
31.8
31.4
33.4
33.6
32.7
35.0
36.1
35.7
36.2
36.8
39.1
38.7
39.2
¿En este problema cual variable se considera independiente y cual dependiente?
La variable independiente es el diámetro y la variable dependiente son las horas de uso.
Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuales son algunos hechos especiales?
La gráfica muestra que entre el diámetro y las horas de uso existe una correlación lineal positiva, ya que cuando aumenta x también aumenta y.
Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos).
La línea recta que mejor explica la relación entre el diámetro y las horas de uso, esta dada por:
Y = - 519 + 21.0 x
Coef.
Predictor Coef de EE T P
Constante -519.40 25.20 -20.61 0.000
x 21.0470 0.7647 27.52 0.000
S = 14.8168 R-cuad. = 97.7% R-cuad.(ajustado) = 97.5%
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 166288 166288 757.45 0.000
Error residual 18 3952 220
Total 19 170240
A continuación se muestran los valores ajustados para Y y el de los residuos e.
x Y Y e = y – Y
26.2 16 31.2 -15.2
25.7 32 20.7 11.3
26 48 27 21
27.7 64 62.7 1.3
28.3 80 75.3 4.7
29.5 96 100.5 -4.5
30.1 112 113.1 -1.1
31.8 128 148.8 -20.8
31.4 144 140.4 3.6
33.4 160 182.4 -22.4
33.6 176 186.6 -10.6
32.7 192 167.7 24.3
35 208 216 -8
36.1 224 239.1 -15.1
35.7 240 230.7 9.3
36.2 256 241.2 14.8
36.8 272 253.8 18.2
39.1 288 302.1 -14.1
38.7 304 293.7 10.3
39.2 320 304.2 15.8
Se acepta la H0, debido a que el valor de p= 0.000.
¿La calidad del ajuste es satisfactoria? Argumente.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.98832566
Coeficiente de determinación R2 0.97678761
R2 ajustado 0.97549803
Error típico 0.69576713
Observaciones 20
La calidad de ajuste si es satisfactoria, debido a que el valor del coeficiente de determinación R2 es muy cercano a R2 ajustado.
Si en diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa herramienta?
Y = - 519 + 21.0 x
= - 519 + 21(45) = - 519 + 945 = 426
Horas de uso Diámetro (mm)
426 45
Señale el valor de la pendiente de la recta e interprételo en términos prácticos.
Sxy = 7900.8
Sxx = 375.4
Por lo tanto β1 = 21.0
El valor de la pendiente de la recta es: 21.0
Obtenga el error estándar de estimación y comente que relación tiene este con la calidad de ajuste.
σ =√(Syy- β1(Sxy/(n-2))) =√(170240-21( 7900.8/18) ) = √(4323.2/18) =√240.17 = 15
¿Cuál es el propósito general del análisis de regresión?
Modelar en forma matemática el comportamiento de una variable de respuesta en función a una o más variables independientes (factores).
7. En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la siguiente tabla.
Tiempo (minutos) Rendimiento (%)
10 64
15 81.7
20 76.2
8 68.5
12 66.6
13 77.9
15 82.2
12 74.2
14 70
20 76
19 83.2
18 85.3
¿En este problema cual variable se considera independiente y cual dependiente?
Se debe considerar el tiempo de extracción como variable (x) y al rendimiento como la variable dependiente (y), dado que el rendimiento siempre va a variar conforma el tiempo y no viceversa.
Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuales son algunos hechos especiales?
Existe una correlación lineal positiva ya que conforme aumenta el tiempo de extracción también aumenta el rendimiento.
Haga un análisis de regresión (ajuste de línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos).
La línea recta que mejor explica la relación entre el tiempo y el rendimiento, esta dada por:
y = 58.0 + 1.19 x
Coef.
Predictor Coef de EE T P
Constante 57.958 6.284 9.22 0.000
x 1.1949 0.4150 2.88 0.016
S = 5.42100 R-cuad. = 45.3% R-cuad.(ajustado) = 39.9%
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 243.68 243.68 8.29 0.016
Error residual 10 293.87 29.39
Total 11 537.56
Se rechaza la prueba de Ho ya que mi valor de P=0. Por lo tanto se acepta la alternativa.
X Y Ajuste Ajuste SE Residuo Residuo estándar
10 64.00 69.91 2.49 -5.91 -1.23
15 81.70 75.88 1.57 5.82 1.12
20 76.20 81.86 2.71 -5.66 -1.20
8 68.50 67.52 3.18 0.98 0.22
12 66.60 72.30 1.92 -5.70 -1.12
13 77.90 73.49 1.71 4.41 0.86
15 82.20 75.88 1.57 6.32 1.22
12 74.20 72.30 1.92 1.90 0.38
14 70.00 74.69 1.59 -4.69 -0.90
20 76.00 81.86 2.71 -5.86 -1.25
19 83.20 80.66 2.38 2.54 0.52
12 85.30 79.47 2.09 5.83 1.17
¿La calidad del ajuste es satisfactoria?
Coeficiente de determinación = 45.3%
El 45% de la variación observada en el rendimiento es explicada por el modelo, la calidad de ajuste no es satisfactoria.
Coeficiente de determinación ajustado= 0.3987
Para fines de predicción se recomienda un coeficiente de determinación ajustado de 0.7 este este es otro indicador que el modelo no hace estimación con precisión.
Coeficiente de correlación= 0.6732
Se observa que en la gráfica de probabilidad normal la mayor parte de los puntos tienden a ajustarse a la línea recta pero en la de residuo contra valor ajustado hay cierto patrón, el modelo registra falla.
Se concluye que aunque el modelo es significativo, la intensidad de la relación lineal entre las variables no es muy fuerte.
Destaque el valor de la pendiente de la recta e interprételo en términos prácticos.
El valor de la pendiente de la recta es 1.1949, en términos prácticos, tan solo es la cantidad que se incrementa o disminuye la variable Y para cada unidad que se incrementa de X.
Estime el rendimiento promedio que se espera a un tiempo de extracción de 25 minutos y obtenga un intervalo de confianza para esta estimación.
El intervalo de confianza está dado por:
87.83±2.2281√(29.38[(1/12)+((25-14.66)^2÷(170.66))] )
87.83±2.2281√20.85
87.83±10.174
Por lo tanto el intervalo de confianza es 77.65 <= E(yIx0=25)<= 98.004
8. En cierta empresa es usual pagar horas extra para cumplir con los tiempos de entrega.
En este centro productivo un grupo de mejora de calidad trata de reducir la proporción de piezas malas, para ello deciden investigar la relación entre la cantidad de horas extra, X, y el porcentaje de artículos defectuosos, Y. En la siguiente tabla se muestran los datos obtenidos.
SEMANA HORAS EXTRA DEFECTOS %
1 340 5
2 95 3
3 210 6
4 809 15
5 80 4
6 438 10
7 107 4
8 180 6
9 100 3
10 550 13
11 220 7
12 50 3
13 193 6
14 290 8
15 340 2
16 115 4
17 362 10
18 300 9
19 75 2
20 93 2
21 320 10
22 154 7
¿De estas variables cual se puede suponer independiente y cual dependiente?
...