MATEMATICA
plantica16 de Junio de 2014
4.608 Palabras (19 Páginas)176 Visitas
Intervalos de Confianza y Prueba de Hipótesis
Antes de iniciar estudiaremos lo relacionado a probar diferentes tipos de hipótesis, empezando por definir que es una hipótesis y una prueba de hipótesis, enlistaremos los pasos para probar una hipótesis, y realizaremos pruebas de hipótesis relativas a la media de una población y a las medias de dos poblaciones.
Aunque se pueden establecer pruebas de hipótesis para la proporción, para la varianza de una población o para dos poblaciones. Esto último ya se presentó en clase.
En lo que respecta a Intervalos de confianza ya se presentó un documento similar
¿Qué es una hipótesis?
Hipótesis es una afirmación o suposición respecto al valor de un parámetro poblacional
Son ejemplos de hipótesis, o afirmaciones hechas sobre un parámetro poblacional las siguientes:
• El ingreso mensual promedio de los trabajadores de la Ciudad de Puebla es $4500.00
El rendimiento de una reacción es del 80%
• El 20% de los delincuentes capturados son sentenciados a prisión
• El consumo de gasolina promedio por auto es de 10 litros diarios
Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan grandes que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar la población entera es tomar una muestra de la población de interés. De esta manera podemos probar una afirmación para determinar si la evidencia soporta o no la afirmación.
¿Qué es una prueba de hipótesis?
Una prueba de hipótesis comienza con una afirmación o suposición acerca de un parámetro poblacional, tal como la media poblacional. Una hipótesis podría ser que la colegiatura que pagan los estudiantes universitarios de la República Mexicana es en promedio de 3000 pesos. Para comprobar esta hipótesis no podríamos contactar a todos los estudiantes universitarios de la república, el costo sería exorbitante. Para probar la validez de esta afirmación podríamos seleccionar una muestra de la población de estudiantes y basados en ciertas reglas de decisión, aceptar o rechazar la hipótesis. Si la media muestral fuera de 1000 pesos ciertamente tendríamos que rechazar la hipótesis, pero si la media muestral fuera 2990 pesos ¿podríamos asumir que la media poblacional si es de 3000 pesos?, ¿podemos atribuir al error de muestreo la diferencia de 10 pesos entre las dos medias, o es una diferencia significativa?
Prueba de hipótesis es un procedimiento basado en una evidencia muestral (es decir en el estudio de una muestra) y la teoría de la probabilidad. Este procedimiento se usa para determinar si la hipótesis es una afirmación razonable para no ser rechazada, o es una afirmación poco razonable y ser rechazada.
Procedimiento de 4 pasos para probar una hipótesis
Hay un procedimiento de cuatro pasos que sistematizan la prueba de hipótesis. Para ilustrar el procedimiento, completemos el ejemplo anterior. Supongamos que la muestra es de 20 estudiantes y el nivel de significancia es de .05. Los cuatro pasos son los siguientes:
Paso 1. Establecer las hipótesis nula y alternativa
El primer paso es establecer la hipótesis a ser probada. Esta es llamada la hipótesis nula, simbolizada por H0, el subíndice cero implica “cero diferencia”. Usualmente el término “no” es encontrado en la hipótesis nula significando “no cambio”. La hipótesis nula de la introducción podría ser “la colegiatura mensual promedio de los estudiantes universitarios no es diferente de 3000 pesos”. Esto es lo mismo que decir “…es igual a 3000 pesos”. La hipótesis nula se puede simbolizar H0: µ = 3000.
La hipótesis nula es una afirmación que será aceptada si los datos de la muestra no nos proveen de evidencia convincente de que es falsa, es decir, si se acepta la hipótesis nula decimos que la evidencia no es suficiente para rechazarla pero no podemos afirmar que es verdadera.
La hipótesis alterna es la afirmación que se acepta si se rechaza la hipótesis nula. Esta hipótesis, también llamada hipótesis de investigación, se simboliza con Ha. La hipótesis alterna es aceptada si la evidencia proporcionada por la muestra es suficiente para afirmar que la Ho es falsa.
En este ejemplo las hipótesis serían las siguientes:
Ho: La colegiatura promedio de los estudiantes no es diferente de 3000 pesos
Ho: µ = 3000
Ha: La colegiatura promedio de los estudiantes es diferente de 3000 pesos
Ha: µ ≠ 3000
Paso 2. Determinar el criterio de decisión o de contraste
Determinar el criterio de decisión o de contraste consiste en especificar el nivel de significancia, el tipo de distribución, y los valores críticos.
Existen cuatro posibilidades al tomar una decisión respecto a una hipótesis:
Aceptar Ho Rechazar Ho
Ho verdadera Decisión correcta Error
Tipo I
Ho falsa Error
Tipo II Decisión correcta
Nivel de significancia es la probabilidad de rechazar una hipótesis nula verdadera
El nivel de significancia es simbolizado por α, y también es conocido como nivel de riesgo. Este último término es más apropiado porque es el riesgo que se toma de rechazar una hipótesis verdadera.
No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 es aplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 a sondeos políticos. Tú como investigador debes decidir el nivel de significancia antes de colectar la muestra de datos.
El tipo de distribución se determinará dependiendo de la naturaleza de la hipótesis y del tamaño de la muestra. Cuando la hipótesis es relativa a medias poblacionales o proporciones y las muestras son grandes (n>30) se utiliza la distribución normal. Cuando es relativa a la media y la muestra es pequeña (n≤30) se utiliza la distribución t de student.
Cuanto se trata de hipótesis sobre la varianza se usa la distribución Chi2 y cuando se trata de hipótesis entre varianzas de dos poblaciones se usa la distribución F.
Los valores críticos se determinan con el nivel de significancia y la distribución correspondiente. Estos son los valores de la variable de la distribución que limitan el área crítica, que es la parte de la curva que corresponde al nivel de significancia.
En este ejemplo de la colegiatura el nivel de significancia es de .05, se utiliza la distribución t de student porque la muestra es pequeña, los valores críticos se encontraron de la siguiente manera
El área crítica cuando la hipótesis alterna tiene el símbolo ( ≠ ) se divide en dos y se dice que el problema es de dos colas, y cada cola vale α/2. Si la Ha tiene el signo (<) el problema es de la cola izquierda, si tiene el signo(>) es de la cola derecha, y en ambos casos la cola vale α. Este problema es de dos colas:
Paso 3. Calcular el estadístico de prueba
El estadístico de prueba es un valor obtenido de la información de la muestra para compararlo con el criterio de contraste y rechazar o aceptar la hipótesis. El estadístico de prueba cambia de acuerdo a la distribución que se utilice. En este problema el estadístico de prueba es t y se simboliza t*
Supongamos que en una muestra las colegiaturas de los estudiantes universitarios entrevistados son las siguientes:
2821 3102 2398 2511 3222
2329 3109 2725 3627 2933
3822 3044 3125 2650 2741
3054 3281 2292 2952 2462
La media y la desviación estándar de la muestra son 2910 y 411.95 respectivamente, se procede enseguida a calcular el error estándar y la t*
Paso 4. Tomar decisión y conclusión
Una regla de decisión es establecer las condiciones sobre las cuales la hipótesis nula es rechazada o no rechazada. Si el estadístico de prueba queda dentro de la zona crítica la hipótesis nula deberá ser rechazada. Si el estadístico de prueba queda fuera de la zona crítica la hipótesis nula no deberá ser rechazada.
En el ejemplo de las colegiaturas, como el estadístico de prueba quedó fuera de la zona crítica la hipótesis nula no puede ser rechazada. La conclusión podría ser la siguiente:
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de .05”
Sin embargo en la clase se presentó otra forma de tomar la conclusión usando el valor p o p value. En este ejemplo se trata de una hipótesis bilateral y el valor de referencia es alfa = 0.05. A partir del resultado del estadístico de prueba t = -0.097 (menos cero punto noventa y siete) se obtiene en R el p value correspondiente con la instrucción pt(-0.097,19) de donde resulta un p value de 0.4618711 (observe que esta es un area bajo la curva hacia la derecha)
Dado que le valor p es mayor que el valor de referencia, entonces se dice que no existe evidencia para rechazar la Hipótesis nula. Es decir que
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de .05”
Prueba de hipótesis relativas a dos medias
El siguiente ejemplo nos muestra el procedimiento de prueba de hipótesis relativas a la media de dos poblaciones.
Ejemplo
Se realizó un estudio con un nivel de significancia de .05 para investigar si el número de u.e.a´s que se dan de baja
...