ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Comprobación de hipótesis ANOVA (Análisis de varianza)


Enviado por   •  15 de Abril de 2015  •  4.583 Palabras (19 Páginas)  •  352 Visitas

Página 1 de 19

UNIVERSIDAD TÉCNICA DE AMBATO.

FACULTAD DE CIENCIAS ADMINISTRATIVAS

CARRERA ORGANIZACIÒN DE EMPRESAS

MODALIDAD PRESENCIAL.

MODULO FORMATIVO APLICACIÓN METODOLOGICA DE ANÁLISIS ESTADÍSTICOS.

COMPROBACIÓN DE HIPÓTESIS (ANOVA).

INTEGRANTES:

Adame Christian

Montesdeoca Salas

Salazar Edwin

DOCENTE: Ing. Mg. Carlos Pinos.

PARALELO: IV “B”

Período: Octubre 2014 - Marzo 2015.

TEMA.

Comprobación de hipótesis ANOVA (Análisis de varianza).

ANALISIS DE LA VARIANZA

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.

Las medias de las poblaciones no son iguales

El ANOVA requiere el cumplimiento los siguientes supuestos:

Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales.

Las K muestras sobre las que se aplican los tratamientos son independientes.

Las poblaciones tienen todas igual varianza.

EL PROCEDIMIENTO

Parte A: La hipótesis nula y alternativa

La hipótesis nula y alternativa se expresa en términos de la igualdad de las medias poblacionales para todos los grupos de tratamientos.

Parte B: El formato de los datos que se analizan

Los datos pueden listarse en forma tabular, con una columna separada para cada tratamiento t. el número de observaciones en las columnas (n1, n2, n3,.., nt) no necesita ser igual.

Parte C: Los cálculos para un ANOVA de un sentido.

Cálculos específicos necesarios para efectuar un ANOVA de un sentido.

Cada una de estas cantidades se asocia con una fuente específica de variación dentro de los datos de la muestra.

La suma de los términos cuadrados: cuantificación de las dos fuetes de variación.

Los tratamientos, TR.SSTR es el valor de la suma de cuadrados que refleja la variación entre las medias de los diferentes tratamientos y la media general para todos los tratamientos (x ̿). Ponderado de acuerdo al tamaño de las muestras para los grupos de tratamientos respectivos, el SSTR expresa la cantidad de variación que se puede atribuir a los tratamientos.

El error de muestreo, E. SSE es la suma de cuadrados de las diferencias entre los valores y las medias observadas para sus respectivos grupos de tratamiento; expresa la cantidad de variación debido al error de muestreo.

La variación total, T. SST es la cantidad total de variación, o SST= SSTR+SSE

Hacer comparables las magnitudes de las dos fuentes de variación. MSTR es el cuadrado medio de la variación entre los grupos. Se obtiene dividiendo SSTR entre un numero apropiado de grados de libertad (t – 1), de modo que MSTR se pueda comparar con MSE en el cálculo del estadístico de la prueba.

MSE es el cuadrado medio de la variación dentro del grupo. Se obtiene dividiendo SSE entre un número adecuado de grados de libertad (N – t).

Parte D: El estadístico de la prueba, el valor crítico y la regla de decisión.

El estadístico de la prueba: la razón F, MSTR/MSE es el estadístico de la prueba en el que nos basamos para llegar a una conclusión.

El MSTR estima la varianza común ( ) con base a la variación entre las medias de los tratamientos.

MSE estima la varianza común con base en la variación dentro de los grupos de tratamientos mismos, y el estadístico de la prueba F, es la razón de estas diferentes estimaciones de la varianza común.

El valor crítico y la regla de decisión.

La prueba es de cola derecha y para un nivel de significancia especifico (∞), rechazamos Ho: µ1=µ2=…..=µt, si el valor calculado de F > F [∞, (t – 1), (N – t).

La distribución F, es la distribución de muestreo para la relación de dos varianzas muéstrales cuando se extraen repetidamente muestras aleatorias de la misma población con distribución normal.

Si las poblaciones en un experimento en realidad tienen la misma media (y considerando las suposiciones de varianza iguales y distribuciones normales), el valor calculado de nuestro estadístico de prueba debe ser aproximadamente de 1.0, si Ho es verdadera.

En la medida que el F calculado sea mayor que 1.0, tenderemos a concluir que las medias poblacionales tal vez no sean iguales. Por supuesto, la conclusión específica que obtengamos dependerá de:

El nivel de significancia que hayamos seleccionado

Nuestra comparación con el F calculado con el F critico

EJEMPLO

Una empresa de contabilidad desarrollo tres métodos con el propósito de guiar a sus empleados temporales para elaborar las declaraciones individuales de impuestos. Para comparar la eficacia de estos métodos, se prepara una prueba en la cual cada uno de los 10 empleados temporales se asigna de manera aleatoria para utilizar uno de los tres métodos para elaborar una hipotética solicitud de devolución de impuestos. Los tiempos de elaboración (en minutos). Con un nivel de significancia de 0.025

¿Podemos concluir que los tres métodos pueden tener la misma eficacia?

RESOLUCION:

método 1 método 2 método 3

15 10 18

20 15 19

19 11 23

14

x ̅.1=17 x ̅.2=12 x ̅.3=20

Número total de observaciones:

∑▒n= N= 4+3+3 N= 10

La gran media (x ̿)

∑▒x/N= (15+20+19+14+10+15+11+18+19+23)/10 = 16.4 minutos

Suma de cuadrados en los tratamientos, SSTR

∑▒nj (x ̅.j - x ̿)2 = 4(17-16.4)2+3(12-16.4)2+3(20-16.4)2

SSTR= 98.4

Suma de cuadrados de los errores, SSE

∑▒〖(x〗ij - x ̅.j)2

= [█(■((15-17)^2@(20-17)^2@(19-17)^2 )@(14-17)^2 )] + [█(█(■((10-12)^2@(15-12)^2@(11-12)^2 )))] + [█(■((18-20)^2@(19-20)^2@(23-20)^2 ))]

SSE=54

Suma de cuadrados total, SST

∑▒〖(x〗ij -x ̿)2

= [█(■((15-16.4)^2@(20-16.4)^2@(19-16.4)^2 )@(14-16.4)^2 )] + [█(█(■((10-16.4)^2@(15-16.4)^2@(11-16.4)^2 )))] + [█(■((18-16.4)^2@(19-16.4)^2@(23-16.4)^2 ))]

SST=152.4 O SST=SSTR+SSE SST= 98.4+ 54= 152.4

Cuadrado medio de los tratamientos (MSTR) y cuadrado medio del error (MSE)

El SSTR y el SSE ahora deben dividirse entre sus respectivos grados de libertad de modo que:

Se puedan comparar

Cada uno sea una estimación diferente de la varianza común, que se supone comparten las poblaciones de los grupos de tratamiento.

Recuerde que tenemos t=3 tratamientos y un total de N=10 observaciones.

Estimado de ( ) que se basa en la variación entre los tratamientos:

MSTR= SSTR/(t-1) = 98.4/(3-1)= 49.20

Estimado de ( ) que se basa en la variación dentro de los tratamientos o variación por el error de muestreo:

MSE= SSE/(N-t) = 54/(10-3) = 7.71

El estadístico de la prueba, F

Es la razón de las dos estimaciones de ( )

F= MSTR/MSE = 49.20/7.71 = 6.38

El valor crítico de F y la decisión

El valor de F calculado es mayor que 1.0, lo cual sugiere que las medias poblacionales tal vez no sean iguales, pero la pregunta importante es: ¿es bastante grande para que podamos rechazar la hipótesis nula con un nivel de significancia del 0.025?

Valor critico de F = F (∞, v1, v2)

Numerador de F

v1= (t – 1) o (3-1) = 2

Denominador de F

v2= (N-t) o (10-3) = 7

Por lo tanto, para ∞=0.025, t=3 tratamientos y un total de N=10 observaciones el F critico es F= (0.025, 2, 7) = 6.54

El valor calculado (F= 6.38) no excede el valor critico (6.54), y no podemos rechazar la hipótesis nula Ho: µ1 = µ2 = µ3. Con un nivel de significancia de 0.025 los métodos de capacitación pueden tener la misma eficacia.

VALOR CRITICO DE F

∞ F calculado F(∞, 2, 7) decisión

0,01 6,38 no es > 9,55 No rechazar Ho

0,025 6,38 no es > 6,54 No rechazar Ho

0,05 6,38 excede 4,74 Rechazar Ho

RESOLUCION DEL EJERCICIO CON LA UTILIZACION DEL PROGRAMA EXCEL

método 1 método 2 método 3

15 10 18

20 15 19

19 11 23

14

ANÁLISIS DE VARIANZA DE UN FACTOR

RESUMEN

Grupos Cuenta Suma Promedio Varianza

Columna 1 4 68 17 8,666667

Columna 2 3 36 12 7

Columna 3 3 60 20 7

ANÁLISIS DE VARIANZA

Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F

Entre grupos 98,4 2 49,2 6,37777778 0,02648078 6,5415203

Dentro de los grupos 54 7 7,71428571

Total 152,4 9

EL DISEÑO DE BLOQUES ALEATORIOS.

Si las características de los participantes o las unidades de prueba tienen una gran influencia en las mediciones que obtenemos, podemos estar observando las diferentes composiciones de los grupos, en lugar de los efectos de los tratamientos.

Por ejemplo, supongamos que hemos seleccionado de manera aleatoria a 12 personas de una comunidad pequeña, y que estas participarán en un experimento diseñado para compartir la eficacia de cuatro diseños diferentes de faros delanteros para visión nocturna.

Si tenemos grupos de tratamientos de igual tamaño y los asignamos de manera aleatoria, es probable que la representación de conductores de mayor edad no sea exactamente igual en los cuatro grupos. Esto reduciría nuestra capacidad para comparar los diseños, dado que la visión nocturna tiende a disminuir con la edad. En esta situación, el valor de la variable que en realidad queremos medir (es decir, la distancia en la cual los faros permiten leer una señal de transito) resulta muy afectada por otra variable (la categoría de edad) no considerada en el experimento.

En el diseño de bloques aleatorios que se presentan en esta sección, primero se organizan las personas o unidades de prueba en grupos o bloques similares, antes de asignar los tratamientos. Esto permite reducir la magnitud de la variación debida a los errores. Por ejemplo, en el experimento de visión nocturna descrito, el uso del diseño de bloques aleatorios garantizaría que los grupos de tratamientos sean comparables en términos de las categorías de edad de sus integrantes. La aplicación de este control sobre la variable categoría de edad (denominada variable de formación de bloques) permite comparar mejor la efectividad de los diseños, o tratamientos, de faros delanteros.

Si bien controlamos, o bloqueamos una variable, nuestro principal interés consiste en poner a prueba si las medias poblacionales pueden ser iguales para todos los grupos de tratamientos. En consecuencia, las hipótesis nula y alternativa son:

H_0: u_1=u_2=⋯u_t para los tratamientos de 1 a t.

H_1: Las medias poblacionales no son iguales.

El modelo y las suposiciones.

Igual que con el ANOVA de un sentido, la hipótesis nula y alternativa también se pueden expresar en términos de una ecuación en la cual cada observación individual se considera la suma de varios componentes. Para el diseño de bloques aleatorios, estas componentes incluyen los efectos de los tratamientos y de los bloques:

En el diseño de bloques aleatorios, sólo hay una observación o medición para cada combinación de bloque y tratamiento. Por ejemplo, como se aprecia en la parte B de la tabla, el tratamiento 1 de faros delanteros se asigna a una persona en la categoría de menos de 30 años, a una persona de 30 a 60 años, y a una persona de más de 60 años. Por lo tanto cada combinación de nivel de bloque y tratamiento corresponde a una muestra de una persona o unidad de prueba.

El diseño de bloques aleatorios supone: 1) para cada combinación de bloque y tratamiento (es decir, cada combinación de los valores de i y j), la muestra de tamaño 1 se selecciona de manera aleatoria de una población en la cual los valores de Xij tienen una distribución normal; 2) las varianzas son iguales para los valores de Xij en estas poblaciones, y 3) no hay interacción entre los bloques y los tratamientos. En un diseño de bloques aleatorios, la interacción está presente cuando el efecto de un tratamiento depende del bloque al cual se ha asignado. Por ejemplo, en el experimento de los faros delanteros de la parte B de la tabla, el desempeño de un diseño específico en relación con los demás debe ser aproximadamente el mismo, sin tener en cuenta cual grupo de edad es considerado. Igual que con el ANOVA de un sentido, si no se cumple una o más de estas suposiciones existe un método alternativo.

El procedimiento.

El procedimiento para efectuar el diseño de bloques aleatorios suele parecerse al del ANOVA de un sentido.

Parte A: las hipótesis nula y alternativa.

Las hipótesis nula y alternativa se expresan en términos de la igualdad de las medias poblacionales para todos los grupos de tratamientos.

Parte B: el formato de los datos que se analizan.

Los datos se dan en forma tabular, como se muestra, con una columna diferente para cada tratamiento t y una fila diferente para cada bloque n.

Parte C: los cálculos para el diseño de bloques aleatorios.

La parte C de la tabla 12.7 describe los cálculos para el diseño de bloques aleatorios; cada cantidad se asocia con una fuente específica de variación dentro de los datos de la muestra.

La suma de los términos cuadrados: cuantificación de las fuentes de variación.

Los tratamientos, TR. SSTR es la suma de cuadrados que refleja la magnitud de la variación entre las medias de los tratamientos y la gran media, x.

El error de muestreo, E. SSE es la suma de cuadrados que refleja la magnitud total de la variación debida al error de muestreo. Se calcula con mayor facilidad calculando primero el SST y luego restando el SSTR y el SSB.

La variación total, T. SST es la suma de cuadrados que refleja la magnitud total de la variación en los datos, donde cada valor de datos se compara con la gran media y luego se calculan los cuadrados de las diferencias y se suman.

Parte D: El estadístico de prueba, el valor crítico y la regla de decisión.

El estadístico de prueba. Este es MSTR/MSE. Igual que con el diseño de un sentido o completamente aleatorio, MSTR estima la varianza común con base en la variación entre las medias de los tratamientos, mientras que MSE estima la varianza común con base en la varianza dentro de los grupos de tratamientos. El estadístico de prueba es la razón de estas diferentes estimaciones de la varianza común.

El valor crítico y la regla de decisión. La prueba es de cola derecha y para un nivel de significancia específico.

APLICACIONES.

EJEMPLO (Distribución normal).

Para ilustrar la aplicación del diseño de bloques aleatorios, utilizaremos un ejemplo que corresponde a nuestro análisis inicial para este procedimiento. Luego se presentaran los resultados de computadora y su interpretación.

El equipo de desarrollo de producción de una empresa de faros delanteros de automóviles analiza cuatro diseños diferentes. Prepara una prueba para comparar su eficacia en condiciones de manejo nocturno, y la medición que interesa es la distancia a la cual el conductor puede leer una señal de tránsito suburbana. Al reconocer que los conductores jóvenes tienen una mejor visión nocturna que los mayores, el equipo planificó el experimento de modo que el grupo de edad sea una variable de formación de bloques. Se seleccionan cuatro personas de cada grupo de edad (o bloque), y luego los tratamientos se asignan de manera aleatoria a los integrantes de cada bloque. Cuando cada persona se asigna a uno de los diseños de faros, se mide la distancia a la cual puede leer la señal de tránsito. Con un nivel de significancia de 0.05, ¿Los diseños de los faros pueden tener la misma eficacia?

SOLUCIÓN.

Para esta prueba, la hipótesis nula es H_0: u_1=u_2=u_3=u_4 para los cuatro diseños de faros, o tratamientos. Según la hipótesis nula, las medias poblacionales de los tratamientos son iguales; es decir, los cuatro diseños tienen la misma eficacia. La hipótesis alternativa sostiene que las medias poblacionales no son iguales y que los diseños no tienen la misma eficacia. Los cálculos preliminares, es decir, las medias tanto de los bloques como de los tratamientos y la gran media aparecen en la tabla 12.8.

Suma de cuadrados de los tratamientos, SSTR

En el diseño de bloques aleatorio, los grupos de tratamientos son de igual tamaño, y en este experimento cada grupo tiene n=3 personas.

SSTR=n∑_(j=1)^t (Xj-X)^2

=3 [█((84.00-82.50)^2+(80.00-82.50)^2@(85.67-82.50)^2+(80.33-82.50)^2 )] y SSTR=69.77

Suma de cuadrado de los bloques, SSB

La suma de cuadrados que compara las medias de los bloques con la media general se calcula como

SSTR=n∑_(i=1)^n (Xi-X)^2

=4[(88.75-82.50)^2+(83.75-82.50)^2+(75.00-82.50)^2 ] y SSB=387.50

Suma de cuadrados total, SST

La SST considera los valores individuales de los datos. En esta suma de cuadrados cada valor de Xij se compara con la gran media, x:

SST= ∑_(j=1)^t ∑_(i=1)^n (Xij-x)^2

=[█((90-82.50)^2 + (87-82.50)^2 + (93-82.50)^2 + (82-82.50)^2@+(86-82.50)^2 + (79-82.50)^2 + (87-82.50)^2 + (83-82.50)^2@+(76-82.50)^2 + (74-82.50)^2 + (77-82.50)^2 + (73-82.50)^2 )]y SST=473

Suma de cuadrados debida al error, SSE.

Esta cantidad se obtiene mas fácilmente calculando las cantidades anteriores y luego usando la relación

SST=SSTR+SSB+SSE, o

SSE=SST-SSTR-SSB=473.00-69.77-387.50 y SSE=15.73

Cuadrado medio debido a los tratamientos (MSTR) y Cuadrado medio debido al error (MSE).

Ahora el SSTR y el SSE se dividen entre sus respectivos grados de libertad para que : 1) se puedan comparar y 2) cada uno sea una estimación diferente de la varianza común que se supone comparten las poblaciones de los grupos de tratamientos. Recuerde que tenemos t=4 tratamientos y n=3 bloques.

La estimación de la o^2 que se basa en la variación entre los tratamientos es

MSTR=SSTR/(t-1)=69.77/(4-1) y MSTR=23.26

La estimación de la o^2 que se basa en la variación dentro de los tratamientos, o error de muestreo, es

MSE=SSE/(t-1)(n-1) =15.73/(4-1)(3-1) y MSE=2.62

El estadístico de prueba, F

El estadístico de prueba es la razón de las dos estimaciones de

o^2, o F=MSTR/MSE=23.26/2.62 y F=8.88

Hemos generado la información descrita en la parte C de la tabla 12.7, y los resultados se resumen en la tabla del ANOVA de bloques aleatorios que aparece en la tabla 12.9.

El valor critico de F y la decisión.

La prueba se efectúa con un nivel de significancia de ∞=0.05, y el valor crítico de F se puede encontrar en apéndice A como

Valor critico de F=F(∞,v_1,v_2 )

Los df asociados con el numerador de F son

v_1=(t-1) o (4-1)=3

Los df asociados con el denominador de F son

v_2=(t-1)(n-1)=(4-1)(3-1)=6

Para ∞=0.05,v_1=3 y v_2=6,el F critico es F(0.05,3,6)=4.76. El valor calculado (F=8.88) excede el valor crítico y, con un nivel de 0.05, podemos rechazar la hipótesis nula de que las medias poblacionales son iguales. En este nivel de significancia, concluimos que los tratamientos de faros no tienen la misma eficacia.

Prueba de la influencia de la variable de formación de bloques.

Nuestro principal interés es controlar la influencia de la variable de formación de bloques, no medir su efecto. Si queremos examinar el efecto de dicha variable, podemos utilizar este procedimiento:

Hipótesis para poner a prueba el efecto de la variable de formación de bloques:

H_0=Los niveles de la variable de formación de bloques tienen el mismo efecto.

H_1=Cuando menos un nivel tiene un efecto diferente de los demás.

Valor calculado de F=MSB/MSE,obtenido igual que en la tabla 12.7.

Valor crítico de F=(∞,v_1,v_2 ).

Donde:

v_1=(n-1),los df asociados con el numerador,y

v_2=(t-1)(n-1),los df aspociados con el denominador

y n=el número de bloques,t=el número de tratamientos.

Regla de decisión:Si F calculado >F(∞,v_1,v_2 ),rechazar H_0 con un nivel de ∞.

En conclusión, la hipótesis nula se rechazaría con un nivel de significancia de 0.01. Los resultados sugieren que tal variable de formación de bloques ha sido muy efectiva.

Los resultados con computadora.

Se listan las medias de los tratamientos y de los bloques, al igual que la gran media, y el resultado (redondeado) se asemeja al resultado de la tabla 12.9.

El ANOVA de bloques aleatorios y la prueba t para muestras dependientes.

Cuando solo hay dos tratamientos, el ANOVA de bloques aleatorios es equivalente a una de las pruebas, en este caso a la prueba t de dos colas para muestras dependientes. Al aplicar el ANOVA de bloques aleatorios a datos que provienen de muestras dependientes, cada valor de (X_1-X_2) representa un bloque diferente.

Por ejemplo, si quisiéramos comparar los cocientes de inteligencia (IQ) de una muestra formada por cuatro parejas de cierto vecindario, el formato de los datos podrían ser como los de la tabla 12.10. No podemos asignar de manera aleatoria el tratamiento (el sexo del cónyuge), porque en este caso analizamos casos que ya existen en lugar de efectuar un experimento diseñado.

ANÁLISIS DE VARIANZA DE DOS FACTORES

El procedimiento de análisis de varianza de dos factores que se utilizan con datos separados en categorías formadas de acuerdo con dos factores el método de esta selección requiere que primero hagamos una prueba de interacción entre los dos factores .Después hacemos una prueba para determinar si el actor de renglón tiene algún efecto y también para determinar si el factor de columna tiene algún efecto

Existe una interacción entre dos factores y el efecto de uno de los factores cambia las diferentes categorías del otro factor.

Procedimiento del ANOVA para dos factores

Paso 1 EL EFECTO DE INTERRELACION: En el análisis de factores, inicie probando la hipótesis nula de que no existe interacción entre los dos factores

Paso 2 EFECTO RENGLON/COLUMNA: Si rechazamos la hipótesis nula de ninguna interacción de actores, entonces tenemos que detenernos aquí no debemos preceder con las dos pruebas adicionales. Si existe una interacción entre los factores, no debemos considerar los efectos de algunos factores sin considerar del otro. Sino rechazamos la hipótesis nula de ninguna interacción entre los actores, entonces debemos proceder a probar las siguientes dos hipótesis.

En el paso 1 no rechazamos la hipótesis nula de ninguna interacción, por lo que procedemos con las siguientes dos pruebas de hipótesis identificadas el paso dos.

Caso especial una observación por celda y ninguna interacción

Si nuestros datos muéstrales consisten únicamente e una observación por celda perdemos CM(de la interacción) SC(de la interacción) y gl(de la interacción)ya que estos valores están basados en varianzas muéstrales calculado para cada celda individual si existen una observación por celda no hay variación dentro de las celdas individuales y esas varianzas muéstrales no pueden ser calculadas. Cuando tenemos una observación por celda procedemos de la siguiente manera: si parece razonable suponer (con base en el conocimiento de las circunstancias) que no existe interacción entre los dos factores, haga dicha suposición y después proceda como antes a probar las siguientes dos hipótesis por separado.

LA SUMA DE TÉRMINOS CUADRADOS; CUANTIICACION DE LAS FUENTES DE VARIACION

LA VARIACION DEBIDA A LOS FACTORES: SSA es la suma de cuadrados que relega la variación provocada por la diferencia entre los niveles del factor A. SSB es la suma de cuadrados que relega la variación provocada por la diferencia entre los niveles del actor factor B.

LA VARIACION DE VIDA A LAS INTERACCIONES ENTRE LOS NIVELES DE LOS FACTORES .SSAB Es la suma de cuadrados que refleja la variación provocada por las interacciones entre los diferentes niveles del actor a y b .Esto se obtiene más fácilmente calculando primero los otros términos de la suma de cuadrados esto es SSAB= SST-SSA-SSB-SSE.

ERROR DE MUESTREO E .SSE es la suma de cuadrados que refleja la variación de vida al error de muestreo En este cálculo, se compara cada valor de los datos con la media de su propia celda.

LA VARIACION TOTAL, T. SST es la suma de cuadrados que releja la variación general de los datos, donde cada observación se compara con la gran medida , y luego las diferencias se elevan al cuadrado y se suman.

EL ESTADISTICO DE PRUEBA LOS VALOTRES CRITICOS Y LA REGLA DE DECISIÓN.

Para cada hipótesis nula que se va a poner a prueba, se calcula un estadístico de prueba diferente .El numerador y el denominador son estimaciones diferentes a la varianza que se supone comparten las poblaciones de las celdas .Para cada hipótesis nula el valor critico de F dependerá el nivel de significancia seleccionado y del número de grados de libertad asociados con el numerador y denominador estadístico F. Al poner a prueba cada HO, EN LA TABLA SE MUESTRAN VALORES DE v1y v2.

Si un F calculado resulta mayor que F[∞,v1 y v2 ] se rechaza lo hipótesis nula correspondiente.

EJEMPLO

Una empresa de aeronaves considera tres diferencias aleatorias para usar la construcción de las alas de un nuevo avión. Cada aleación se produce de cuatro grosores diferentes (1=el más delgado, 4= el más grueso). Se constituyen dos muestras para cada combinación de aleación y grosor y luego cada una de las 24 prueba se someten a un dispositivo de laboratorio que las dobla una y otra vez hasta que ocurre una falla. Para cada muestra de la prueba se registra el número de dobleces antes de una falla. Con cada nivel de significancia de 0.05, analice:

Si los grosores de la aleación afectan la durabilidad

Si el tipo de aleación afecta a la durabilidad

Si la durabilidad se ve afectada por las interacciones entre los grosores y el tipo de aleación.

SOLUCION

En el término de estos datos las tres hipótesis nulas sostienen que:

Ningún nivel de factor A(grosor) tiene efecto.

Ningún nivel de factor B (tipo de aleación) tiene efecto.

No existe interacción entre los niveles de los factores A y B.

Hay cuatro niveles del factor A y tres niveles del factor B, lo cual llevan a 4*3=12 combinaciones, o celdas dentro de cada celda hay r=2 observaciones o repeticiones.

Hipótesis nula y alternativa que se ponen a prueba

Formato de datos

Cálculos

Valores críticos y decisiones

CONCLUSIONES Y RECOMENDACIONES.

CONCLUSIONES.

La prueba ANOVA es una prueba paramétrica y como tal requiere una serie de supuestos para poder ser aplicada correctamente. Denominada ANOVA o análisis de la varianza, en realidad nos va a servir no solo para estudiar las dispersiones o varianzas de los grupos, sino para estudiar sus medias y la posibilidad de crear subconjuntos de grupos con medias iguales.

En forma general sirve para probar hipótesis a través de analizar la variabilidad (varianza).

Puede utilizarse para comparar entre sí las medias de los resultados obtenidos por diversos, métodos de análisis y determinar si las medias de las poblaciones son todas iguales o si alguna difiere de las demás.

Desde el punto de vista práctico, existen múltiples paquetes estadísticos que permiten ejecutar rápidamente los cálculos del ANOVA. Lo que es interesante, pero de igual forma es muy necesario poder conocer cómo se extraen cada uno de los datos.

RECOMENDACIONES.

El método ANOVA es muy importante dentro de la Estadística y su aplicación en el campo profesional, por lo que su estudio y comprensión es de vital importancia sobre todo para realizar comparaciones entre tres o más grupos (comparaciones múltiples).

Básicamente divide la variación total en tus observaciones en fuentes de variación, estas fuentes son tus hipótesis o modelo y la residual o debida al error experimental. A través de comparar la variación debida a tu hipótesis con la residual puedes decidir acerca de la hipótesis. Si la variación residual es más grande (para decidir qué tan grande usas la significancia) entonces tu hipótesis no es cierta. Si la variación es mayormente provocada por tu hipótesis

BIBLIOGRAFIA / LINKOGRAFIA.

ESTADISTICA (Mario F. Triola) Décima Edición

...

Descargar como  txt (27.9 Kb)  
Leer 18 páginas más »
txt