ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Estadística Inferencial

Geovanny1294JNR4 de Noviembre de 2013

2.887 Palabras (12 Páginas)345 Visitas

Página 1 de 12

Error de muestreo

El error de muestreo es la desviación de la muestra seleccionada de las verdaderas características, rasgos, comportamientos, cualidades o figuras de toda la población.

¿Por qué sucede este error?

El error del proceso de muestreo ocurre cuando los investigadores toman diferentes sujetos de la misma población, y aún así, los sujetos tienen diferencias individuales. Debes recordar que cuando tomas una muestra, se trata de un subconjunto de toda la población y, por lo tanto, puede haber una diferencia entre la muestra y la población.

La causa más frecuente de dicho error es un procedimiento de muestreo sesgado. Todo investigador debe tratar de establecer una muestra que esté libre de sesgos y sea representativa de toda la población. Así, el investigador es capaz de minimizar o eliminar el error de muestreo.

Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso de aleatorización y muestreo de probabilidad para minimizar el error del proceso de muestreo, pero igualmente es posible que todos los sujetos asignados al azar no sean representativos de la población.

El resultado más común de error de muestreo es el error sistemático en donde los resultados de la muestra difieren significativamente de los resultados de toda la población. Se entiende que si la muestra no es representativa de toda la población, lo más probable es que los resultados de la muestra difieran de los resultados de toda la población.

Tamaño de la muestra y error de muestreo

Dados dos estudios exactamente iguales, dos métodos de muestreo iguales y la misma población, el estudio con un tamaño de muestra más grande tendrá menos error del proceso de muestreo que el estudio con un tamaño menor de la muestra. Debes recordar que a medida que aumenta el tamaño de la muestra, se acerca al tamaño de toda la población y, por lo tanto, se aproxima a todas las características de la población, disminuyendo el error del proceso de muestreo.

Desviación estándar y error de muestreo

La desviación estándar se utiliza para expresar la variabilidad de la población. Más técnicamente, es la diferencia promedio de todas las puntuaciones reales de los sujetos de la media o promedio de todas las puntuaciones. Por lo tanto, si la muestra tiene una alta desviación estándar, se deduce que la muestra también tiene un alto error del proceso de muestreo.

Se entiende más fácilmente si relacionas la desviación estándar con el tamaño de la muestra. Debes tener en cuenta que a medida que aumenta el tamaño de la muestra, la desviación estándar disminuye.

Imagina que tienes sólo 10 sujetos. Con este tamaño de la muestra tan pequeño, la tendencia de sus resultados es que variarán mucho, produciendo una alta desviación estándar. Ahora imagina que el tamaño de la muestra aumentó a 100. La tendencia de sus puntuaciones es a agruparse, produciendo una desviación estándar baja.

Distribución de muestreo

Las distribuciones de muestreo constituyen una pieza importante de estudio por varias razones. En la mayoría de los casos, la viabilidad de un experimento dicta el tamaño de la muestra. La distribución de muestreo es la distribución de probabilidad de una muestra de una población en lugar de toda la población.

En palabras más simples, supongamos que de una determinada población tomas todas las muestras posibles de tamaño n y calculas una estadística (por ejemplo, media) de todas las muestras. Si luego preparas una distribución de probabilidad de esta estadística, obtendrás una distribución de muestreo.

Las propiedades de la distribución de muestreo pueden variar dependiendo de cuán pequeña sea la muestra en comparación con la población. Se supone que la población se distribuye normalmente como generalmente sucede. Si el tamaño de la muestra es lo suficientemente grande, la distribución de muestreo también estará cerca de lo normal.

Si éste es el caso, entonces la distribución de muestreo puede ser totalmente determinada por dos valores: la media y la desviación estándar. Estos dos parámetros son importantes para calcular la distribución de muestreo si se nos da la distribución normal de toda la población.

Distribución de muestreo de la media y la desviación estándar

La distribución de muestreo de la media se obtiene tomando la estadística bajo estudio de la muestra como la media. Calcular esto significa tomar todas las muestras posibles de tamaño n de la población de tamaño N y luego trazar la distribución de probabilidad. Se puede demostrar que la media de la distribución de muestreo es, de hecho, la media de la población.

Sin embargo, la desviación estándar es diferente para la distribución de muestreo en comparación con la población. Si la población es lo suficientemente grande, esto está dado por:

Donde σ es la desviación estándar de la distribución de la población y σx̄ es la media de población.

Otras distribuciones

Estas fórmulas son válidas únicamente cuando la población se distribuye normalmente. Si éste no es el caso, entonces la media y la desviación estándar de la distribución de muestreo serán diferentes y dependerán del tipo de distribución de la población.

La distribución normal es una de las distribuciones de probabilidad más simples, por lo que es muy fácil de estudiar y analizar. Podemos encontrar fácilmente fórmulas matemáticas para las estadísticas de distribución de muestreo que queremos encontrar.

Sin embargo, cuando la distribución no es normal, esto puede ser muy complicado y tales formulaciones matemáticas sencillas podrían ser difíciles de encontrar o hasta imposibles en algunos casos. En estos casos, usamos métodos aproximados porque encontrar el valor exacto implicará el estudio de cada muestra de tamaño n tomada de la población, lo que es muy difícil y requiere mucho tiempo.

Teorema de Limite Central

Definición:

El teorema central del límite es uno de los resultados fundamentales de la estadística. Este teorema nos dice que si una muestra es lo bastante grande (generalmente cuando el tamaño muestral (n) supera los 30), sea cual sea la distribución de la media muestral, seguirá aproximadamente una distribución normal. Es decir, dada cualquier variable aleatoria, si extraemos muestras de tamaño n (n>30) y calculamos los promedios muestrales, dichos promedios seguirán una distribución normal. Además, la media será la misma que la de la variable de interés, y la desviación estándar de la media muestral será aproximadamente el error estándar.

La importancia del teorema central del límite radica en que mediante un conjunto de teoremas, se desvela las razones por las cuales, en muchos campos de aplicación, se encuentran en todo momento distribuciones normales o casi.

Contextualizando lo anterior tenemos: La distribución de la media muestral de una población normal es una distribución normal con la misma media poblacional y con desviación típica el error estándar. Este hecho nos permite calcular probabilidades cuando tenemos una muestra de una variable con distribución normal y desviación típica conocida. Cuando no conocemos la desviación típica de la variable, también podemos hacer cálculos con la distribución t de Student.

Cuando la muestra es lo bastante grande, la solución nos viene dada por uno de los resultados fundamentales de la estadística: el teorema del límite central.

La fórmula formal que se utiliza para resolver problemas de este tema es:

Es muy común encontrar esta fórmula con una variable estandarizada Zn en función a la media muestral como se muestra en la imagen...

Ahora tenemos la fórmula de la siguiente manera:

También podemos encontrar esta fórmula en versiones no normalizadas:

Esas son las fórmulas que manejan varios autores, pero nosotros usaremos 3 formulas diferentes para resolver el problema haciéndolo lo mas fácilmente posible. Estas son las fórmulas que usaremos:

Error Estándar de la Media Muestral:

Partiendo de muestras en poblaciones infinitas. El error estándar es la raíz cuadrada de la varianza muestral expresado por:

El término σ/√n , es conocido con el nombre de error estándar de estimación de la media muestral.y se puede interpretar como el grado de variabilidad que tiene la media muestral con respecto ala media poblacional. En otras palabras es una medida de la incertidumbre que existe al estimar la media poblacional a partir de la media muestral

Intervalos de Confianza:

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.

Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:

P(-1.96 < z < 1.96) = 0.95

(Lo anterior se puede comprobar

...

Descargar como (para miembros actualizados) txt (18 Kb)
Leer 11 páginas más »
Disponible sólo en Clubensayos.com