ANALISIS DE VARIANZA DE UNA VÍA O DIRECCIÓN
Mikitiesto22 de Octubre de 2013
3.226 Palabras (13 Páginas)702 Visitas
ANALISIS DE VARIANZA DE UNA VÍA o DIRECCIÓN
El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar la variación entre muestras y la variación al interior de las mismas mediante la determinación de varianzas. Es llamado de un criterio porque analiza un variable independiente o Factor ej: Velocidad. Como tal, es un método estadístico útil para comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite poner a prueba hipótesis tales como:
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras independientes son:
1. Ambas poblaciones son normales.
2. Las varianzas poblacionales son iguales, esto es,
Como el ANOVA de un criterio es una generalización de la prueba de t para dos muestras, los supuestos para el ANOVA de un criterio son:
1. Todas las poblaciones k son normales.
2.
El método de ANOVA con un criterio requiere del cálculo de dos estimaciones independientes para , la varianza poblacional común. Estas dos estimaciones se denotan por . se denomina estimación de la varianza entre muestras y se denomina estimación de la varianza al interior de las muestras. El estadístico tiene una distribución muestral resultando:
El valor crítico para la prueba F es:
Donde el número de grados de libertad para el numerador es k-1 y para el denominador es k(n-1), siendo el nivel de significancia.
k = número de muestras.
El Procedimiento es el siguiente :
1. Determinar si las muestras provienen de poblaciones normales.
2. Proponer las hipótesis.
3. Encontrar las medias poblacionales y las varianzas.
4. Encontrar la estimación de la varianza al interior de las muestras y sus grados de libertad asociados glw.
5. Calcular la gran media para la muestra de las medias muéstrales.
6. Determinar la estimación de la varianza entre muestras y sus grados de libertad asociados.
7. Hallar el valor del estadístico de la prueba F.
8. Calcular el valor crítico para F basado en glb y glw.
9. Decidir si se rechaza H0.
Calculo Manual
Se utilizan las fórmulas siguientes:
Suma de cuadrados total (SST o SCT)
*** ** Xi valores individuales
* *** **
X Media de medias
* * **
* **
Suma de cuadrados de los tratamientos o niveles (SSTr o SCTr):
Media X3
*
5
5
4 *
* Media X2
Media X1
Suma de cuadrados del error (SSE o SCE):
** *
Xi Xi
*
** * ** *
*** * Xmedia 3
X media 1 ** *
* Xmedia 2 Xi *
O también SCE = SCT - SCTr
Grados de libertad:
Gl. Totales = n – 1
Gl. Tratamientos = c -1
Gl. Error = n – c
Cuadrados medios (MS o CM):
CMT = SCT / Gl. SCT
CMTr = SCTr / Gl. SCTr
CME = SCE / Gl. SCE
Estadístico calculado Fc:
Fc = CMTr / CME
P value = distr.f (Fc, Gl. CMtr, Gl. CME)
F crítica de tables o Excel = distr.f.inv(alfa, Gl. CMT, Gl. CME)
Si P es menor a alfa o Fc es mayor a Ft se rechaza Ho indicando que los efectos de los diferentes niveles del factor tienen efecto significativo en la respuesta.
Distr. F
NO RECHAZAR ZONA DE RECHAZo
Alfa
La tabla de ANOVA final queda como sigue:
TABLA DE ANOVA
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Entre muestras (tratam.) SCTR c-1 CMTR CMTR/CME
Dentro de muestras (err.) SCE n-c CME
Variación total SCT n-1 CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
Si las medias son diferentes se puede aplicar la prueba de Tukey o DMS como sigue:
PRUEBA DE TUKEY
Se utiliza para diseños balanceados (todos los tratamientos tienen
asignado el mismo número de elementos)
Se utiliza el estadístico T
Se compara T vs la diferencia en valor absoluto de
cada par de medias, si esta dif. Excede a T, las medias son diferentes
o iguales en caso contrario. n = 16 r = 4
c = 4 Alfa=0.05
Por ejemplo: 3.6 CME = 19.6875 T
Medias q.05,4,12= 4.2 9.31
X1 = 145 !X1 - X2!= 0.25 X1=X2
X2= 145.25 !X1-X3! = 12.75 X1<>X3
X3= 132.25 !X1-X4!= 15.75 X1<>X4
X4= 129.25 !X2-X3!= 13 X2<>X3
!X2-X4!= 16 X2<>X4
!X3-X4!= 3 X3=X4
X4 X3 X1 X2 DMS =3.41
129.25 132.25 145 145.2
DMS
MEDIAS
MEDIAS
IGUALES DIFERENTES
9.45
Otro método más conservador es el la DIFERENCIA MÍNIMA SIGNIFICATIVA
DMS
r=4
F = DISTR.F.INV(alfa, gl. =1, gl. CME =12)
CME = 19.6875
r= 4
F.05,1,12 4.75
187.0313 46.75781 6.837968
Para el caso de diseños no balanceados se utiliza el método DMS
para comparar cada par de muestras
r j es el número de elementos asignados al tratamiento j
r k es el número de elementos asignados al tratamiento k
Verificar si X1 = X2 y si X2 = X3 en el ejemplo de empleados.
DMS 1,2 ? DMS 2,3 ?
Por ejemplo: 3.4
Para comparar X1-X2
r1 = 5 r2=4 X1=21.74 X2=21.5
DMS =
0.1965
X1-X2=
Se concluye que X1 y X2 son diferentes.
DISEÑO DE BLOQUES COMPLETOS AL AZAR: DBCA
Conocido como diseño de doble vía, se aplica cuando el material es heterogéneo. Las unidades experimentales homogéneas se agrupan formando grupos homogéneos llamados bloques.
Tratamientos A, B, C, D, E
Bloque I: B A E C D
Bloque II: C B D E A
Bloque III: B E A D C
Bloque IV: D C A E B
Las fuentes de variación para el análisis estadístico son:
Fuentes Grados de libertad
Tratamiento (t-1) = 4
Bloques (r-1) = 3
Error (t-1) (r-1)=12
Características:
1. Las unidades experimentales son heterogéneas.
2. Las unidades homogéneas están agrupadas formando los bloques.
3. En cada bloque se tiene un número de unidades igual al número de tratamientos (bloques completos)
4. Los tratamientos están distribuidos al azar en cada bloque.
5. El número de repeticiones es igual al número de bloques.
MODELO
Cada observación del experimento es expresada mediante una ecuación lineal en los parámetros, el conjunto conforma el modelo para el diseño de bloques completos al azar:
Yij = + i + j + ij i=1,2,...,t
j=1,2,...,r
μ = Parámetro, efecto medio
τ i = Parámetro, efecto del tratamiento I
β j = Parámetro, efecto del bloque j
εij= valor aleatorio, error experimental de la u.e. i,j
Yij = Observación en la unidad experimental.
APLICACIÓN: Estudio de Variedades forrajeras en Camote. Se realizó un ensayo de 4 nuevas variedades forrajeras (V1, V2, V3 y V4) frente a una variedad ya conocida. Se dispuso realizar el ensayo en la época de verano en Selva. Cada parcela de 10 m2 con un total de 15 parcelas. Se formaron bloques de 5 parcelas homogéneas. Se midió el peso fresco y seco y se registró el peso en kilos. Follaje Fresco
V1 Testigo V2 V3 V4 Y.j
I 17.9 7.0 19.8 15.2 12.7 72.6
II 20.8 5.9 16.7 21.0 14.2 78.6
III 21.4
...