El análisis de regresión se usa con el propósito de predicción
Humberto DominguezPráctica o problema23 de Febrero de 2016
1.351 Palabras (6 Páginas)561 Visitas
Introducción.
El análisis de regresión se usa con el propósito de predicción. La meta del análisis de regresión es desarrollar un modelo estadístico que se pueda usar para predecir los valores de una variable dependiente o de respuesta basados en los valores de al menos una variable independiente o explicativa. Este capítulo se centra en un modelo de regresión lineal simple, que usa una variable numérica independiente X para predecirla variable numérica dependiente Y.
Para establecer una relación cuantitativa entre X y Y es necesario disponer de cierta información muestral. Esta información consiste de un conjunto de pares de observaciones de Y y X, donde cada uno de estos pares pertenece a una unidad elemental particular de la muestra. Por ejemplo, suponga que el rendimiento de un proceso químico está relacionado con la temperatura de operación, o la experiencia profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de personas, la producción agraria y la cantidad de fertilizantes utilizados, etc. Si mediante un modelo matemático es posible describir tal relación, entonces este modelo puede ser usado para propósitos de predicción, optimización o control
Ejercicios.
- En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación (20 datos):
HORAS DE USO | 16 | 32 | 48 | 64 | 80 | 96 | 112 | 128 | 144 | 160 |
DIAMETRO (mm) | 26.2 | 25.7 | 26.0 | 27.7 | 28.3 | 29.5 | 30.1 | 31.8 | 31.4 | 33.4 |
HORAS DE USO | 176 | 192 | 208 | 224 | 240 | 256 | 272 | 288 | 304 | 320 |
DIAMETRO (mm) | 33.6 | 32.7 | 35.0 | 36.1 | 35.7 | 36.2 | 36.8 | 39.1 | 38.7 | 39.2 |
- Diga cuál es la variable dependiente y la variable independiente.
- Mediante un diagrama de dispersión analice la relación entre estas dos variables.
- Haga un análisis de regresión (ajuste una línea recta a estos datos y aplique prueba de hipótesis.
- Si el diámetro máximo tolerado es de 45, ¿cuántas horas de uso estima que tiene esa herramienta?
- El consejo municipal de una ciudad ha reunido datos sobre el número de accidentes menores de tránsito y el número de juegos de fútbol soccer que se celebran en la ciudad durante un fin de semana.
JUEGOS DE FUTBOL | 20 | 30 | 10 | 12 | 15 | 25 | 34 |
ACCIDENTES MENORES | 6 | 9 | 4 | 5 | 7 | 8 | 9 |
- Desarrolle la ecuación de estimación de la recta que mejor describa estos datos.
- Determine el número de accidentes menores de tráfico que ocurrirán en un fin de semana durante el cual tienen lugar 33 partidos de fútbol soccer en la ciudad.
- Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando:
Estaturas (X) | 152 | 155 | 152 | 155 | 157 | 152 | 157 | 165 | 162 | 178 | 183 | 178 |
Pesos (Y) | 50 | 61.5 | 54.5 | 57.5 | 63.5 | 59 | 61 | 72 | 66 | 72 | 84 | 82 |
- Desarrolle la ecuación de estimación que describa los datos anteriores.
- Calcule el residual de la estimación.
- Usando el análisis de varianza, pruebe la hipótesis de que no existe relación entre la variable de peso y la variable estatura, con una certeza del 99%.
- El encargado de la campaña de un candidato a la presidencia de estados unidos deseaba averiguar si había una relación entre el número de votos que obtuvo su candidato y el número de horas que dedicó a la campaña en diversas elecciones primarias. Los resultados de las primarias anteriores fueron los siguientes:
Elección primaria | Hrs. dedicadas a la campaña | Número de votos(miles) |
Indiana | 40 | 200 |
Nueva jersey | 26 | 175 |
Nueva York | 49 | 415 |
Massachusetts | 48 | 320 |
Texas | 42 | 275 |
Pennsylvania | 40 | 300 |
California | 52 | 475 |
Wisconsin | 34 | 125 |
Illinois | 39 | 400 |
Ohio | 40 | 315 |
- Ajuste la recta de mínimos cuadrados con la cual podamos pronosticar el número de votos obtenidos en términos de las horas dedicadas a la realización de la campaña
- Utilice la ecuación que obtuvo en el inciso anterior para pronosticar el número de votos que se pueden obtener cuando se dedican 37 horas a la realización de la campaña
- Pruebe la hipótesis nula Ho=12 contra la hipótesis alterna H1<12 con un nivel de significancia de 0.01 exprese con palabras la hipótesis que se dese probar y también discuta si es del todo razonable realizar la prueba
- El costo de decorar con jardinería ornamental casas recién construidas en una comunidad fue proporcionado por una firma de decoración de jardinería ornamental en relación con una muestra de 12 casas de las cuales se conocían los ingresos familiares y los montos de las hipotecas. La información, expresada en miles de dólares se da en la siguiente tabla:
FAMILIA | GASTOS EN J. | INGRESO F. | MONTO DE H. |
1 | 2.7 | 18.6 | 24.2 |
2 | 3.6 | 20.4 | 32.1 |
3 | 1.8 | 19.4 | 28.2 |
4 | 5.4 | 24.2 | 36.1 |
5 | 5.2 | 24 | 30.4 |
6 | 6.3 | 28.4 | 40.1 |
7 | 1.3 | 37.2 | 48.2 |
8 | 8.4 | 56.8 | 80.3 |
9 | 4.6 | 26.4 | 20.1 |
10 | 5.9 | 23.6 | 32.6 |
11 | 7.1 | 45.4 | 54.7 |
12 | 4.1 | 24.6 | 48.2 |
- Desarrolle la ecuación de estimación que escriba los datos anteriores.
- Utilice la ecuación anterior para estimar los gastos en jardinería cuando el ingreso familiar es 43.2 y el monto de la hipoteca asciende a 51.3 miles de dólares
- Realice un análisis de varianza con una confiabilidad del 98% para probar que el ingreso familiar y el monto de la hipoteca, influyen de alguna manera en los gastos de jardinería y también discuta si es del todo razonable realizar esta prueba
- La información anexa se ha obtenido de una muestra aleatoria de inquilinos de departamentos en una ciudad. Estamos intentando predecir el, alquiler (en dólares por mes) basándonos en el tamaño del departamento (número de habitaciones) y su distancia del centro de la cuidad (en millas)
RENTA | No. DE HABT | DISTANCIA |
230 | 2 | 1 |
880 | 6 | 1 |
300 | 3 | 2 |
340 | 4 | 3 |
200 | 2 | 10 |
190 | 1 | 4 |
- Calcule la ecuación de mínimos cuadrados que relacione mejor estas tres variables.
- Si alguien está buscando un departamento de dos recamaras situado a dos millas del centro de la ciudad, ¿Qué renta espera pagar?
- Pruebe la hipótesis nula contra la hipótesis alterna con un nivel de significancia de 0.01 exprese con palabras la hipótesis que se desea probar en función del problema y argumente claramente su respuesta.
Resultados en Excel
1.
DIAMETRO | HORAS | X^2 | Y^2 | XY |
26.2 | 16 | 686.44 | 256 | 419.2 |
25.7 | 32 | 660.49 | 1024 | 822.4 |
26 | 48 | 676 | 2304 | 1248 |
27.7 | 64 | 767.29 | 4096 | 1772.8 |
28.3 | 80 | 800.89 | 6400 | 2264 |
29.5 | 96 | 870.25 | 9216 | 2832 |
30.1 | 112 | 906.01 | 12544 | 3371.2 |
31.8 | 128 | 1011.24 | 16384 | 4070.4 |
31.4 | 144 | 985.96 | 20736 | 4521.6 |
33.4 | 160 | 1115.56 | 25600 | 5344 |
33.6 | 176 | 1128.96 | 30976 | 5913.6 |
32.7 | 192 | 1069.29 | 36864 | 6278.4 |
35 | 208 | 1225 | 43264 | 7280 |
36.1 | 224 | 1303.21 | 50176 | 8086.4 |
35.7 | 240 | 1274.49 | 57600 | 8568 |
36.2 | 256 | 1310.44 | 65536 | 9267.2 |
36.8 | 272 | 1354.24 | 73984 | 10009.6 |
39.1 | 288 | 1528.81 | 82944 | 11260.8 |
38.7 | 304 | 1497.69 | 92416 | 11764.8 |
39.2 | 320 | 1536.64 | 102400 | 12544 |
653.2 | 3360 | 21708.9 | 734720 | 117638.4 |
[pic 1]
...