Chi Cuadrada
abril1026 de Abril de 2014
2.924 Palabras (12 Páginas)263 Visitas
PRUEBA CHI CUADRADA “X2”
ESTADISTICA DESCRIPTIVA
ALUMNA: KISAY ABRIL RAMIREZ TORREBLANCA
PROFR: ING. HECTOR SANCHEZ CASTRO
GRUPO: PS703
INTRODUCCION
La Chi cuadrada fue originada por el matemático Karl Pearson (1857−1936), advirtió que cuando un científico realiza un experimento de resultados aleatorios, generalmente tiene en mente como referente un «modelo teórico ideal» que de antemano establece cómo debería ser el comportamiento y cuáles deberían ser los resultados estadísticos esperados del experimento. Sin embargo, en el mundo real es muy normal que los resultados empíricos obtenidos dentro de Muestras Estadísticas sobre la realización de un experimento aleatorio no coincidan plenamente con los resultados teóricos esperados. En muchos casos es normal que ocurran grandísimas fluctuaciones en los resultados observados en el experimento aleatorio, y aun así es posible seguir afirmando que esos resultados fluctuantes todavía están ocurriendo dentro de los límites previstos por el modelo teórico ideal. Justamente, una gran dificultad a la que se enfrentaron los primeros científicos de la Modernidad fue cómo hallar una fórmula matemática para determinar con exactitud que las fluctuaciones o variaciones observadas en los resultados de un experimento eran suficientemente «significativas» como para permitir concluir que esos resultados ya no respondían a las expectativas del modelo teórico.
Por ese motivo Karl Pearson hacia 1900 propuso uno de los primeros Test Estadísticos que desde la óptica de las distribuciones de la probabilidad sirve para calcular si los resultados estadísticos de un experimento se alejan significativamente o no de los resultados esperados del modelo teórico, test que actualmente es conocido como el «Test Chi Cuadrado». Luego otros importantes matemáticos han propuesto la axiomatización de diversas funciones matemáticas o estadísticas que permiten definir y calcular los límites ideales a partir de los cuales se puede afirmar con gran certeza que los resultados observados en un experimento aleatorio definitivamente ya no responden a las expectativas teóricas del modelo ideal, es decir, permiten concluir que realmente son muy significativas las disparidades existentes entre los resultados observados y los resultados esperados. Algunas de las más importantes funciones estadísticas empleadas para ese propósito son la prueba Fisher, la prueba T-Student, la prueba Z, el test Wishart, la prueba McNemar, la prueba Q de Cochran, los tests de Bondad de Ajuste, etc.
INDICE
Introducción……………………………………………………………………….….2
¿Qué es la prueba chi cuadrado?.....................................................................4
Tabla de valores…………………………………………………........…….6
Hipótesis…………………………………………………………………………......7
Prueba de bondad de ajuste……………………………………………………....7
Ejemplo…………………………………………………………………….…8
Prueba de independencia……………………………………………………….....9
Prueba de homogeneidad……………………………………………..……….....12
Ejemplo……………………………………………………………………...14
Bibliografía…………………………………………………………………….........16
¿QUE ES LA PRUEBA CHI CUADRADO?
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra.
Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n•pi, donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico tomará un valor igual a 0; por el contrario, si existe una gran discrepancia entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así pues, la región crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de libertad
HIPOTESIS
El “Procedimiento basado en la evidencia muestral y en teoría de probabilidad, que se emplea para determinar si la hipótesis es un enunciado razonable”.
El procedimiento para probar una hipótesis consta de cinco (5) pasos que son los siguientes:
Paso 1: Plantear la Hipótesis Nula (Ho) y la Hipótesis Alternativa (H1).
Paso 2: Seleccionar el Nivel de Significancia.
Paso 3: Calcular el Valor Estadístico de Prueba.
Paso 4: Formular la Regla de Decisión.
Paso 5: Tomar una Decisión.
La prueba de hipótesis es un procedimiento sistemático. Al llegar al paso cinco (5), se tiene ya la capacidad de tomar la decisión de rechazar o no la hipótesis.
PRUEBA DE BONDAD DE AJUSTE
“Es una cuyo objetivo es determinar cuán bien se ajusta un conjunto de frecuencias observadas, a un conjunto esperado de éstas. Considera una sola variable con escala nominal”.
Estas pruebas de Bondad de Ajuste, pueden usarse para cualquier nivel de datos. Mediante esta prueba se puede verificar si los datos obtenidos de un experimento particular siguen alguna distribución particular, por ejemplo, una distribución uniforme, distribución binomial, distribución normal, etc. La prueba necesita la clasificación de los datos muéstrales en una tabla de distribución de frecuencia denominada, frecuencias observadas y esta se compara con las frecuencias esperadas obtenidas utilizando alguna distribución elegida, las frecuencias observadas se denotan por la letra O y las correspondientes esperadas con la letra E tal como se muestra a continuación.
I E1 E2 E3 EJ
II O1 O2 O3 OJ
Para su cálculo, ambas tienen un procedimiento similar al de las pruebas de hipótesis.
EJEMPLO:
En la escuela de Psicología, basándose en informaciones anteriores, al final del semestre antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprobó la mitad, un 6% reprobó todas las materias y un 4% se retiró. Al final del semestre pasado el departamento selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se retiraron. ¿Podemos concluir, a raíz de los resultados, que la información del semestre antepasado se ha vuelto a repetir el semestre pasado?
Hipótesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre antepasado.
Atributos Datos observados Probabilidad Datos esperados
Aprobó todo 287 0,80 320
Aprobó la mitad 49 0,10 40
Reprobó todo 30 0,06 24
Se retiró 34 0,04 16
Total 400 1 400
2 = 27,178
Como tenemos 4 categorías y ningún parámetro estimado los grados de libertad serán: 4-0-1= 3
X2 0,05; 3
Como 27,178 es mayor que 12,84 se rechaza la hipótesis nula.
Conclusión: Los porcentajes no se repitieron el semestre pasado
PRUEBA DE INDEPENDENCIA
La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.
La prueba de independencia del Chi-cuadrado, parte de la hipótesis que las variables (Estado civil y Género) son independientes; es decir, que no existe
...