Estadística Inferencial : Prueba de Hipótesis con 2 muestras y varias muestras con datos categóricos.
virisongaymoreTrabajo2 de Noviembre de 2015
5.281 Palabras (22 Páginas)2.415 Visitas
[pic 1][pic 2]
Instituto Tecnológico de Tlalnepantla.
“Por la realización Tecnológica de mi pueblo”
Asignatura: Estadística Inferencial 1.
Unidad 5: Prueba de Hipótesis con 2 muestras y varias muestras con datos categóricos.
Índice.
Introducción………………………………………………………………………………..3
Prueba de hipótesis para la igualdad de k
medias poblacionales (distribución F)………………………………………………4 a 9
Pruebas de hipótesis para más de dos proporciones……………………………9 a 15
Prueba de bondad de ajuste (distribución Chi- cuadrada X2)…………………15 a 20
Prueba de independencia (distribución Chi- cuadrada X2)……………………20 a 27
Conclusiones…………………………………………………………………………27 a 29
Bibliografía………………………………………………………………………………….30
Introducción:
El análisis de datos categóricos con propósito de toma de decisiones es de vital importancia en la investigación financiera, médica y de las ciencias sociales. Al efectuar una encuesta, por ejemplo, las preguntas se redactan, a menudo, de manera que se den respuestas categóricas, en lugar de respuestas numéricas. Muchos estudios resultan en datos que son categóricos o cualitativos antes que cuantitativos y que admiten más de dos resultados posibles, para este tipo de estudios que involucran datos categóricos es posible usar algunas pruebas de Hipótesis.
Por ese motivo en este reporte se pretende informar, acerca de algunos temas de la Unidad 5 que son de suma importancia, iniciando con la Prueba de Hipótesis para la igualdad de K medias; es decir (distribución F), la cual es una distribución de probabilidad de gran aplicación en la inferencia estadística , fundamentalmente en la contrastación de la igualdad de varianzas de dos poblaciones normales, y , fundamentalmente en el análisis de la varianza. Así mismo se explicará la Prueba de hipótesis para proporciones de k muestras, ésta se usa frecuentemente cuando se desea estimar la proporción de elementos que tienen una característica determinada, las observaciones son de naturaleza cualitativa.
Otro tema a abarcar será el de Chi-cuadrado como prueba de bondad de ajuste, el cual se usa para determinar si una población tiene una distribución teórica específica. La prueba se basa en qué tan buen ajuste se tiene entre la frecuencia de ocurrencia de las observaciones en una muestra observada y las frecuencias esperadas que se obtienen a partir de la distribución hipotética, finalmente se explicará acerca de la Prueba de Independencia, otorgando ejemplos con los cuales se podrá comprender mejor cada uno de los temas.
Prueba de hipótesis para la igualdad de k medias poblacionales
(Distribución F)
La distribución F de Fisher-Snedecor va a desempeñar un papel fundamental en los problemas de inferencia, sobre todo en los relativos al análisis de la varianza.
La definición de la distribución F se puede introducir a partir de la X2.
Si X2n1 X2 n2 son dos variables aleatorias independientes, que siguen una distribución X2 con n 1 y n2 grados de libertad, respectivamente, entonces la variable aleatoria [pic 3] tiene una distribución F con n 1 y n2 grados de libertad.
Se trata también de una familia de distribuciones, que dependen de los parámetros n 1 y n2, donde n 1 es el número de grados asociados a la función del numerador y n2 el número de grados asociados al denominador.
Por consiguiente, la gráfica de F va a depender del orden en que se dan los parámetros n 1 y n2
[pic 4]
La distribución F esta también tabulada para distintos valores de los parámetros y distintos niveles de significación.
Por otro lado, las tablas nos proporcionan el valor de la abscisa. Fa n1 n2, que deja a su derecha un área igual a α en una F con n1 y n2 grados de libertad:
[pic 5]
Proposición: Es una distribución F con n 1 y n2 grados de libertad, se verifica
[pic 6]
Dicho de otro modo la función de probabilidad de esta distribución, depende de dos parámetros n 1 (numerador) y n2 (denominador), que son los grados de libertad de la distribución F, es una distribución asimétrica.
La tabla proporciona valores de la variable F (percentiles) de F n1 n2 (p), siendo n, el número de grados de libertad del numerador y n2 los del denominador.
Del mismo modo la distribución F se parece a la X2/g.l. compara razones de varianzas. Mientras que la X2/g.l. compara una varianza muestral S2 con una varianza poblacional σ2 conocida o hipotética, la distribución F compara dos varianzas muéstrales S1 y S2 para hacer contrastes de hipótesis y para efectuar análisis de experimentos. El contraste F puede ayudar a determinar las características de entrada que producen efectos significativos sobre la salida que se estudia y cuáles son las características de entrada que producen efectos significativos sobre la salida que se estudia y cuáles son las características de entrada que ejercen interacción entre ellas.
Puesto que la distribución F compara pares de varianzas muestrales, ambas varianzas tienen sus correspondientes grados de libertad.
La notación abreviada que se utiliza para la distribución F con j grados de libertad en el numerador y K en el denominador, F (j,k).
En donde las distribuciones F son asimétricas hacia la derecha.
Para ilustrar esto, en el ejemplo de Davis S. Moore:
[pic 7]
“Cabe mencionar que las varianzas muéstrales no pueden ser negativas, el estadístico F solo toma valores positivos y la distribución F no tiene probabilidad a la izquierda de 0. El pico de la curva de densidad F se encuentra cerca de 1. Los valores de F alejados de 1, en cualquier dirección, proporcionan evidencia en contra de la hipótesis de igualdad de las desviaciones típicas.
Las tablas de puntos críticos de F son incomodas de utilizar, ya que necesitamos una tabla distinta para cada par de grados de libertad j y k. La tabla D, al final del libro, da los valores críticos superiores de las distribuciones para p=0.10, 0.05, 0.0025, 0.01 y 0.001”.
Por otro lado la asimetría de las distribuciones F causa complicaciones adicionales. En la distribución normal y en la distribución t, que son simétricas, el punto que tiene una probabilidad de 0.05 a su izquierda no es más que el valor negativo del punto que tiene una probabilidad de 0.05 a su derecha.
Consecuentemente, esto no se cumple en las distribuciones F. En consecuencia, necesitamos tablas distintas para hallar los valores críticos de las colas de la derecha y de la izquierda, o bien tenemos que encontrar alguna manera de evitar la utilización de los valores críticos de las colas de la izquierda.
Aplicaciones.
Ejercicio1: Una profesora del Instituto Tecnológico de Tlalnepantla requiere conocer la diferencia entre las calificaciones de hombres y mujeres en el grupo G41.
Considere los siguientes datos:
Alumnos | Calificaciones σ2 | Tamaño de muestra n |
Hombres | 12 | 7 |
Mujeres | 5 | 8 |
Se utiliza un nivel de significancia de 0.10
¿Existe una diferencia de calificaciones entre hombres y mujeres?
[pic 8]Paso 1
Crear la Hipótesis Nula y Alternativa.
Ho; σ2= σ2
Ha; σ2=σ2
[pic 9]Paso 2
Obtener el nivel de significancia.
α= 0.10
α/2= 0.50
[pic 10]Paso 3
Obtener los grados de Libertad para cada muestra y el valor crítico.
g,l = n-1 = 7-1= 6
g,l= n-1= 8 – 1 = 7
Buscando en tablas= F-Fisher = 3.87
[pic 11]Paso 4
Obtener el valor observado.
F= 12/5 = 2.4
...