ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Preguntas Generadoras


Enviado por   •  13 de Septiembre de 2014  •  5.016 Palabras (21 Páginas)  •  204 Visitas

Página 1 de 21

SELECCIÓN DE LA MUESTRA

A la hora de explotar los datos, probablemente interesará realizar análisis en función de determinadas variables independientes que dividen la muestra en 2 o más grupos (por ejemplo ver las diferencias de opinión de hombres y mujeres). Si exclusivamente se busca saber si existe relación entre dichas variables independientes y las variables dependientes analizadas, existen recursos estadísticos suficientes para hacerlo (test de hipótesis, chi cuadrado, t de student...). Ahora bien, si lo que se quiere es analizar en si mismo el comportamiento de dichos subgrupos, probablemente sea necesaria una muestra superior. Por ejemplo:

Se extrae una muestra representativa de la población mayor de edad de una ciudad compuesta por

384 individuos. Esto supone un error del 5%. La distribución de la muestra por tramos de edad es la que se muestra en la tabla. También se indica cuántos fueron o no al cine.

Se quería saber si dichas personas han ido al cine durante la última semana. Mediante el correspondiente análisis estadístico (por ejemplo el chi cuadrado), se podría conocer si existe o no relación entre la edad del encuestado, y el hecho de que durante la última semana éste haya ido al cine. Ahora bien, si se quiere analizar por separado a aquellas personas de 18 a 30 años que fueron al cine (25 individuos), y estimar a partir de aquí que porcentaje de las personas de 18 a 30 años son hombres, y cuales son mujeres, el error se dispara. No hay que olvidar que sólo se dispone de una muestra de 25 individuos.

Un problema que se puede plantear si la muestra es escasa, y siguiendo con el razonamiento anterior, es el de los sucesivos filtros en el cuestionario. Siguiendo con el ejemplo anterior; a aquellas personas que fueron al cine, se les quiere preguntar además la sala a la que acudió. A priori ya se puede saber que no todas las personas de la muestra habrán acudido al cine. En este ejemplo concretamente son el 16,4%, o lo que es lo mismo, 63 encuestas. Con esta submuestra, difícilmente se podrán hacer estimaciones sólidas de cuál es la cuota de mercado de cada una de las salas de la ciudad.

En conclusión, a la hora de determinar el tamaño de la muestra, hay que prever los análisis que se van a realizar, y las posibles pérdidas de muestra que se producirán en caso de haber filtros en el cuestionario (filtros: preguntas que dan pie a que unos encuestados sigan respondiendo determinadas preguntas y otros no porque no están cualificados para ello). A su vez, existen estudios donde el margen de error debe ser mínimo; no es lo mismo un estudio de opinión donde un margen de error de 5% es más que aceptable, que un estudio electoral.

Las fórmulas para calcular el tamaño de las muestras son diversas, basadas todas ellas en las fórmulas para la estimación del error muestral, ya sea de la proporción, de la media o de la desviación típica.

Dos de las más habituales son las siguientes:

Para muestras finitas:

Para muestras infinitas:

N es el número de individuos que forman el universo.

n es el número de individuos de la muestra.

P y Q son una medida de dispersión de la muestra.

Si no existe información suficiente de la muestra a analizar, se presupone la mayor dispersión (p=0,5 y q=0,5). Resulta evidente pensar que si la población que se va a estudiar es muy homogénea en la variable de análisis, la muestra necesaria será menor. Por ejemplo, en una localidad en la que sólo concurren 2 partidos a las elecciones, y uno ha ganado las últimas celebradas hace 1 mes con un porcentaje de los votos del 90% frente al 10%. Por simplificar el ejemplo, no se produce abstención. Ahora, se quiere conocer cuales serían los resultados de una nueva elección. Por tratarse de una población muy homogénea, no se precisará de tanta muestra. El mayor problema es que en investigación comercial pocas veces se cuenta con una medida de dispersión poblacional suficientemente actualizada.

k o son el nivel de confianza que se pretende conseguir, pero en unidades estandarizadas. Lo habitual es utilizar un 95% de nivel de confianza, lo que significa un de 1,96.

e es el error muestral máximo que se desea cometer. Como norma general, no es recomendable trabajar en el total con errores superiores al 5%.

Establecer el mecanismo para la selección de los encuestados. Dentro de los procedimientos de muestreo, se pueden distinguir dos grandes familias:

1. Los muestreos probabilísticos: muestreo aleatorio simple, estratificado óptimo...

2. Los muestreos no probabilísticos: muestreo por cuotas, bola de nieve...

¿Qué los diferencia? La clave para ver la diferencia, por lo menos a nivel teórico, es la disponibilidad y utilización de una base de sondeo. La base de sondeo es un documento, tipo censo, en el que aparecerían consignados todos los individuos que configuran el universo. Al disponer de él con anterioridad a la selección, se supone que se pueden establecer mecanismos totalmente aleatorios para la selección de los encuestados o lo que es lo mismo, se puede garantizar que todos los individuos tienen la misma probabilidad de formar parte de la muestra. Es decir, sólo cuando se dispone de base de sondeo se puede garantizar la aleatoriedad en la selección de los individuos que configuraran la muestra, y sólo en estos casos estaremos ante un método probabilístico. Por tanto, en sentido estricto, sólo en los casos de utilización de muestreo probabilístico en cualquiera de sus variantes, se podrán hacer estimaciones de parámetros, es decir proyectar los datos a nivel poblacional, porque sólo en caso de muestreo aleatorio, se puede determinar el error muestral.

Así, en el caso más simple de muestreo aleatorio, se le otorgaría a cada individuo un número, y mediante una urna, o un generador de números aleatorios, se determinaría quienes serían los elementos poblaciones a encuestar. Sin embargo, esto plantea sus problemas ¿qué sucede cuando no es posible localizar a un elemento de la muestra? Para este tipo de inconvenientes se establecen soluciones como fijar un número de intentos antes de proceder al reemplazo mediante mecanismos aleatorios.

Pero

...

Descargar como (para miembros actualizados)  txt (32 Kb)  
Leer 20 páginas más »
Disponible sólo en Clubensayos.com