ANOVA (Análisis de varianza)
Enviado por 14_2009 • 1 de Julio de 2013 • 2.832 Palabras (12 Páginas) • 489 Visitas
ANOVA (Análisis de varianza)
Las pruebas de hipótesis son una herramienta útil cuando se trata de comparar dos tratamientos. La experimentación usualmente requiere comparación de más de dos tratamientos simultáneamente, es allí donde se introduce Anova (teniendo en cuenta que es un procedimiento para análisis de factores cualitativos).
El análisis de varianza se deriva de la partición de la variabilidad total en las partes que la componen. ANOVA establece que la variabilidad total en los datos, medida por la suma de cuadrados total, puede ser dividida en una suma de cuadrados de la diferencia entre los promedios de los tratamientos y el gran promedio total más una suma de cuadrados de la diferencia de las observaciones entre tratamientos del promedio del tratamiento. Anova, nos da la herramienta para distinguir si un factor afecta la respuesta en promedio.
Presunciones de anova:
1. Los errores o residuales son independientes y distribuidos de manera normal o gaussiana, con promedio equivalente a 0 y varianza constante. Si su promedio no fuese 0, el modelo estaría subestimando o sobreestimando.
2. Anova presume que todas las varianzas de los niveles del factor son iguales y toma un solo cálculo de varianza llamado Spooled o varianza conjunta.
Anova mira los promedios de cada nivel contra el promedio general y lo llama entre tratamientos. Anova queda con dos estimados de varianza, dentro y entre los niveles; con estos saca un cociente, si las 2 varianzas se parecen, es decir, el cociente es aproximadamente 1, el factor no tiene ningún impacto en la respuesta, pero si este cociente resulta ser grande, entonces el factor tiene mucho impacto en la respuesta.
Para ilustrar se presenta a continuación un ejemplo teniendo en cuenta un solo factor aleatorio:
Observaciones ( n replicas)
Niveles del factor 1 2 … n Totales
Yi. Promedios
Y
i.
1 Y11 Y21 … Yn1 Y11+ Y21+… Yn1
Y1.
2 Y12 Y22 … Yn2 Y12+ Y22+… Yn2
Y2.
.
. .
. .
. … .
. .
. …
a Y1a Y2a … Yna Y1a+ Y2a+… Yan
Ya.
Totales Y..
Y..
A partir de la anterior tabla, se presenta la forma manual de hacer Anova con el fin de entender el concepto que maneja el análisis de varianza. Inicialmente se debe calcular la suma de
cuadrados de los tratamientos:
1 a Y 2
Fuente de variación
SSTratamientos
= ( ∑Yi. ) −
n i =1 N
entre tratamientos
Donde:
n = Numero de tratamientos por cada nivel
N = Numero de tratamientos en total i = 1, 2, 3… a
Luego se debe calcular la suma de cuadrados total:
a n Y 2
SSTotal
= (∑∑Yij ) − N
i =1
j =1
Donde:
N = Numero de tratamientos en total i = 1, 2, 3… a
j = 1, 2, 3…n
Para estimar la suma de cuadrados de los errores se hace la diferencia de la suma de cuadrados total y la suma de cuadrados de los tratamientos:
SSE
= SSTotal
− SSTratamientos
Fuente de variación dentro de
los tratamientos
La tabla de Anova quedaría así:
ANOVA
Fuente de
variación Suma de
cuadrados (SS) Grados de
libertad Promedio de los
cuadrados (MS) Estadístico de
prueba Fo
Tratamientos SS tratamientos a-1 SStratamientos
a − 1 MStratamientos
MSerror
Error SS error N-a SSerror
N − a
Total SS total N-1
Experimento de un solo factor aleatorio.
Este tipo de experimento es el más sencillo y consiste en analizar un solo factor evaluado en diferentes niveles, de manera que se compara las medias de la
...