ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Unidad 2 Estadistica


Enviado por   •  16 de Octubre de 2012  •  2.163 Palabras (9 Páginas)  •  634 Visitas

Página 1 de 9

En el capitulo anterior se describió la relación que existe entre dos conjuntos de medidas de nivel de intervalo o de razón. Una era la variable independiente y la otra la variable dependiente, se observo que si la relación entre las dos variables es lineal, la ecuación de regresión Y’ = a + bX puede predecir la variable dependiente, Y’ basándose en la variable independiente, X. además, el coeficiente de correlación a + 1.00 o a -1.00 (-.88 o 0.88 por ejemplo) indica una relación lineal muy fuerte entre X y Y. un coeficiente cercano a 0 (por ejemplo -0.12 o +0.12) indica que la relación es muy débil.

ANALISIS DE REGRESION MULTIPLE

En el capitulo anterior se vio que la ecuación de regresión lineal con una sola variable independiente tiene forma de Y’ = a + bX. En este caso de la regresión múltiple la ecuación se amplia y puede tener más variables independientes adicionales. La forma general de la ecuación de regresión múltiple con dos variables independientes es:

Se puede aumentar el número de variables independientes. La ecuación general de regresión múltiple con tres variables independientes denotadas por X1, X2, X3 es:

Esto puede ampliarse a cualquier número (k) de variables independientes, siendo la ecuación general de regresión múltiple:

En la ecuación de regresión multiple, la obtención de a, b1, y b2 resulta my tediosa, aun cuando se utiliza una calculadora, debido a la gran cantidad de cálculos. Por ejemplo, con dos variables independientes hay que resolver simultáneamente, tres ecuaciones que son;

Hay muchos paquetes de computación que realizan los cálculos y presentan los resultados. Los paquetes MINITAB, EXCEL, SAS, Y SPSS son cuatro de los más utilizados.

Ejemplo:

El programa MINITA genera el siguiente resultado.

La variable dependiente es el costo de calefacción en enero. Se tiene tres variables independientes. La temperatura media en el exterior, el numero de pulgadas de material aislante en el desván y la antigüedad del calefactor. La formula general de la ecuación de regresión múltiple con tres variables independientes es:

En el caso de la ecuación de regresión múltiple es Y’ = 427 – 4.58X1 – 14.80X2 + 6.10X3. El valor de la intersección es 427. Este es el punto donde la ecuación de regresión cruza al eje Y. los coeficientes de regresión para la temperatura media exterior y la cantidad de material aislante térmico instalado en el desván son negativos. Por tanto se espera una relación inversa. Por cada grado de aumento en la temperatura media exterior, se espera que el costo de la calefacción disminuya $4.58 dólares al mes. Por tanto si la temperatura media de Boston es de 25 ºF, y en Filadelfia 35 ºF, y todo lo demás permanece sin cambios, se espera que en Filadelfia el costo sea menor por $45.80.

La variable “aislante térmico del desván” también muestra una relación inversa: conforme aumenta la cantidad de material aislante que se instala en el desván, el costo de la calefacción de una casa disminuye. Asi que el signo de este coeficiente sea negativo. Por cada pulgada adicional de material aislante, se espera que el costo de la calefacción de casa disminuya $14.80 al mes, independientemente de la temperatura exterior y la antigüedad del sistema calefactor.

ERROR ESTANDAR MULTIPLE DE ESTIMACION

En el ejemplo de la empresa Salsberry Realty, se estimo que el costo de la calefacción en una casa durante el mes de enero, suponiendo que la temperatura exterior sea 30 ºF, que tenga de 5 pulgadas de material aislante en el desván y un calefactor de 10 años de antigüedad, era $276.60 dólares. En esta estimación se espera tener cierto error aleatorio. La calefacción de una casa con estos datos estadísticos, algunas veces costara más y otras costara menos. El error en esta estimación se mide mediante el error estándar múltiple de estimación. El error estándar”, como se le denomina normalmente, se denota por Sy . 123 Los subíndices indican que se empelan tres variables independientes para estimar el valor de Y.

En el ejemplo de Salsberry Realty, K= 3

De nuevo se emplea el problema, en la primera casa la temperatura media en el exterior era 35 ºF, la casa tenía 3 pulgadas de aislamiento térmico en el desván y el calentador tenía 6 años de antigüedad. Sustituyendo las variables de la ecuación de regresión, con estos valores, el costo estimado de la calefacción es $258.90 dólares, que se obtienen de 427 – 4.58(35) – 14.80(3) +6.10(6). Los valores Y’ para las otras casa se encontraron en forma similar y se presentan en la tabla 14.2

El costo real de la calefacción de la primera casa es $250, en comparación con el costo estimado que es $258.90 Esto es, el error de predicción es -$8.90, obtenido de ($250 -258.90). a la diferencia entre el costo real y el costo estimado se le llama residual. Para encontrar el error estándar múltiple de estimación, se determina el residual de cada una de las casa en la muestra, se eleva al cuadrado este residual y después se suman estos cuadrados de los residuales. Esta suma aparece en la esquina inferior derecha de la tabla 14.2

En este problema n= 20 y k=3 (tres variables independientes) así que el error estándar múltiple de estimación es:

HIPOTESIS PARA LA REGRESION MULTIPLE Y LA CORRELACION MULTIPLE

Se enunciaran las hipótesis en las que se basa tanto la regresión múltiple como la correlación múltiple. Como ya se observo en varios de los capítulos anteriores, es necesario identificar estas hipótesis porque S no se satisfacen íntegramente, los resultados podrían presentar un sesgo. Por ejemplo al seleccionar una muestra se supone que todos los elementos de la población tienen una posibilidad de ser seleccionados. Si en una investigación hay que encuestar a todas las personas que esquían, pero no se toma en cuenta a aquellas mayores de 40 años por que se estima que son “demasiado viejos” se estarían sesgando las respuestas hacia los esquiadores más jóvenes. Sin embargo debe mencionarse que en la práctica, apegarse en forma estricta a las hipótesis siguientes en problema de regresión y correlación múltiple, relacionados con el simple cambiante clima de la administración y economía, no siempre es posible.

LA TABLA ANOVA

Como se menciono antes los cálculos de la regresión múltiple son muy laboriosos. Por fortuna se dispone de muchos sistemas de cómputo para realizarlos. La mayor parte de los resultados se presentan en un formato bastante estándar. El cuadro que sigue, proveniente del sistema MINITAB, presentado anteriormente. Comprende la ecuación de regresión, el error estándar de

...

Descargar como (para miembros actualizados) txt (13 Kb)
Leer 8 páginas más »
Disponible sólo en Clubensayos.com