ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Estadistica Varianza

jaguarsuky25 de Mayo de 2014

3.673 Palabras (15 Páginas)293 Visitas

Página 1 de 15

ANÁLISIS DE VARIANZA:

SUMA TOTAL DE CUADRADOS Y SUMA DE CUADRADOS ENTRE GRUPOS, GRADO DE LIBERTAD, PRUEBA F, PRUEBA A POSTERIORES:

Suma total de cuadrados:

Llamaremos a la medida total de variabilidad entre grupos suma total de cuadrados entre grupos: SCG. Al calcularla, habrá que tener en cuenta que se debe dar más peso a las discrepancias que se observen en los grupos en los que haya más medidas:

A veces es útil calcular la suma de cuadrados total. es la suma d los cuadrados de las diferencias de las observaciones y la media global. La expresamos como SCT.

Suma de cuadrados entre grupos:

Es la suma de las desviaciones de cada media muestral para los n grupos, respecto de la media total elevadas al cuadrado.

Ejemplo:

Veamos cómo procederíamos en el cálculo de las sumas de cuadrados total (SCt), la suma de cuadrados entre grupos (SCinter) y la suma de cuadrados dentro de los grupos (SCintra). Supongamos para ello, que en el ejemplo de los métodos de lectura hemos obtenido los siguientes resultados para el rendimiento de las tres muestras seleccionadas:

Tabla I: Rendimiento logrado a partir de 3 métodos de lectura

GRUPOS

A B C

9 5 8

7 8 4

8 4 5

4 6 2

7 7 6

6 9 3

9 7 5

6 3

La suma de cuadrados calculada para una serie de puntuaciones se obtiene a partir de cualquiera de las siguientes expresiones equivalentes, la segunda de las cuales facilita considerablemente el cálculo. Si utilizáramos la primera de ellas, nos veríamos obligados a trabajar con números decimales, lo cual implica siempre un redondeo y una consiguiente pérdida de información.

[D]

En el ejemplo que nos ocupa, podríamos comenzar construyendo una tabla que nos permita el cálculo de la suma de cuadrados total (ver tabla 2). Esta suma de cuadrados total representa la variabilidad total del grupo.

Tabla 2: Tabla para el cálculo de la suma de cuadrados total

Xi Xi2

9 81

7 49

8 64

4 16

7 49

6 36

9 81

A 6 36

B 5 25

8 64

4 16

6 36

7 49

9 81

7 49

C 8 64

4 16

5 25

2 4

6 36

3 9

5 25

3 9

ΣXi = 138

ΣXi2 = 920

Teniendo en cuenta estos cálculos, la suma de cuadrados total será:

[D]

[D]

Calculemos ahora la suma de cuadrados intragrupo, es decir, la variación registrada en el interior de cada uno de los tres grupos considerados. Para un grupo A, con nA puntuaciones, este cálculo podrá realizarse a partir de las diferencias entre cada puntuación y la media del grupo. Utilizaremos la segunda de las expresiones para el cálculo de sumas de cuadrados, que como ya se señaló, resulta más cómoda:

[D]

Para facilitar el cálculo hemos construido la tabla 3.

Tabla 3: Tabla para el cálculo de la suma de cuadrados intragrupos

GRUPOS

A B C

Xi Xi2 Xi Xi2 Xi Xi2

9 81 5 25 8 64

7 49 8 64 4 16

8 64 4 16 5 25

4 16 6 36 2 4

7 49 7 49 6 36

6 36 9 81 3 9

9 81 7 49 5 25

6 36 3 9

n 8 7 8

ΣXi 56 46 36

ΣXi2 412 320 188

[D]

7.00 6.57 4.5

Calcularemos la suma de cuadrados correspondiente a la variación dentro de cada uno de los grupos, teniendo en cuenta la expresión anterior:

SCA-intra = 412 - 562/8 = 20

SCB-intra = 320 - 462/7 = 17.71

SCC-intra = 188 - 362/8 = 26

La suma de cuadrados dentro de los grupos, que recoge la variación intragrupo, mide el grado en que las puntuaciones de cada muestra varían respecto a la media del grupo. Su valor será el resultante de sumar las tres sumas parciales de cuadrados intragrupo.

SCintra = SCA-intra + SCB-intra + SCC-intra

SCintra = 63.71

La suma de cuadrados intragrupos (SCintra) puede expresarse mediante las siguientes fórmulas equivalentes, en las que se indica la suma de todas las sumas de cuadrados parciales correspondientes a los k grupos considerados.

[D]

[D]

La suma de cuadrados entre grupos indica la variabilidad debida a la variable independiente. Para calcularla, prescindiremos de las variaciones intragrupo y consideraremos que las n¡ puntuaciones de cada grupo coinciden con la media.

A partir de tales puntuaciones podemos calcular la suma de cuadradas respecto a la media global para todas las puntuaciones. Así, para un grupo A compuesto de nA puntuaciones, la contribución a la varianza intergrupos en el seno de un grupo más amplio en el que la puntuación media es [D], vendría dada por la correspondiente suma de cuadrados, que podría ser calculada mediante la siguiente expresión:

[D]

La tabla 4 nos facilitará el cálculo de la variación intergrupos correspondientes a cada uno de los tres grupos considerados en el ejemplo. La media de las 23 puntuaciones asciende a 6, como puede comprobar el lector realizando sencillos cálculos.

Tabla 4: Tabla para el cálculo de la suma de cuadrados intergrupos

n [D]

[D]

[D]

8 7 1 1

7 6.57 0.57 0.3249

8 4.5 -1.5 2.25

[D]

SCinter = SCA-inter + SCB-inter + SCC-inter

SCinter = 28.27

En general, la suma de cuadrados intergrupos puede expresarse como la suma de las variabilidad correspondiente a cada uno de los k grupos considera dos, utilizando para ello dos expresiones que resultan equivalentes:

[D]

[D]

En realidad, hubiera bastado hallar el valor de dos de las tres sumas de cuadrados que acabamos de calcular, puesto que la tercera se obtiene a partir de las anteriores. En efecto, dado que la variabilidad total (suma de cuadrados total) puede ser descompuesta en la suma de la variabilidad experimental (suma de cuadrados intergrupos) y la variabilidad debida al error (suma de cuadrados intragrupo), bastaría despejar el valor desconocido en la siguiente expresión:

SCtotal = SCinter + SCinter

Grados de libertad:

Son una cantidad que permite introducir una corrección matemática en los cálculos estadísticos para restricciones impuestas en los datos. Un caso común en estadística es el cálculo de la varianza, donde aparece en el denominador de dicho cálculo una cantidad denominada grados de libertad, no del todo distinta de la cantidad de datos que se procesan.

La estimación de la varianza se calcula con relación al promedio de los datos de la lista a procesar, por lo cual una muestra, o grado de libertad, se ha usado o (dicho de otra manera) ha pasado a ser un grado de esclavitud. Por consiguiente los grados de libertad para el cálculo de la varianza tienen que tener en cuenta ese grado de esclavitud de valor uno, que hay que restarle del número de datos de la lista.

En estadística grados de libertad es un estimador del número de categorías independientes en un test particular o experimento estadístico. Se encuentran mediante la fórmula n-1, donde n=número de sujetos en la muestra (también pueden ser representados por k-1 donde k=número de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales).

Cuando se trata de ajustar modelos estadísticos a un conjunto de datos, los residuos expresados en forma de vector se encuentran habitualmente en un espacio de menor dimensión que aquél en el que se encontraban los datos originales. Los grados de libertad del error los determina, precisamente, el valor de esta menor dimensión.

Ejemplo:

h

5 17 19 -2 4 20

5 21 19 2 4 20

6 19 19 0 0 0

t=57 T=40

Num. De grados de libertad en el numerador de cociente “f”. =(Num. Muestral-1)

(3-1) = 2

Num. De grados de libertad en el denominador del cociente “f” =

Num. De cifras de cada una de las tablas

El denominador y el numerador deben ser aproximadamente iguales si la hipótesis nula es verdadera.

Prueba f:

En estadística se denomina prueba F de Snedecor a cualquier prueba en la que el estadístico utilizado sigue una distribución F si la hipótesis nula no puede ser rechazada. El nombre fue acuñado en honor a Ronald Fisher.

En estadística aplicada se prueban muchas hipótesis mediante el test F, entre ellas:

• La hipótesis de que las medidas de múltiples poblaciones normalmente distribuidas y con la misma desviación estándar son iguales. Esta es, quizás, la más conocida de las hipótesis verificada mediante el test F y el problema más simple del análisis de varianza.

• La hipótesis de que las desviaciones estándar de dos poblaciones normalmente distribuidas son iguales, lo cual se cumple.

En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren dos modelos de regresión, uno de los cuales restringe uno o más de los coeficientes de regresión conforme a la hipótesis nula. El test entonces

...

Descargar como (para miembros actualizados) txt (23 Kb)
Leer 14 páginas más »
Disponible sólo en Clubensayos.com