Preguntas Generadoras

jhojana9313 de Septiembre de 2014

5.016 Palabras (21 Páginas)261 Visitas

Página 1 de 21

SELECCIÓN DE LA MUESTRA

A la hora de explotar los datos, probablemente interesará realizar análisis en función de determinadas variables independientes que dividen la muestra en 2 o más grupos (por ejemplo ver las diferencias de opinión de hombres y mujeres). Si exclusivamente se busca saber si existe relación entre dichas variables independientes y las variables dependientes analizadas, existen recursos estadísticos suficientes para hacerlo (test de hipótesis, chi cuadrado, t de student...). Ahora bien, si lo que se quiere es analizar en si mismo el comportamiento de dichos subgrupos, probablemente sea necesaria una muestra superior. Por ejemplo:

Se extrae una muestra representativa de la población mayor de edad de una ciudad compuesta por

384 individuos. Esto supone un error del 5%. La distribución de la muestra por tramos de edad es la que se muestra en la tabla. También se indica cuántos fueron o no al cine.

Se quería saber si dichas personas han ido al cine durante la última semana. Mediante el correspondiente análisis estadístico (por ejemplo el chi cuadrado), se podría conocer si existe o no relación entre la edad del encuestado, y el hecho de que durante la última semana éste haya ido al cine. Ahora bien, si se quiere analizar por separado a aquellas personas de 18 a 30 años que fueron al cine (25 individuos), y estimar a partir de aquí que porcentaje de las personas de 18 a 30 años son hombres, y cuales son mujeres, el error se dispara. No hay que olvidar que sólo se dispone de una muestra de 25 individuos.

Un problema que se puede plantear si la muestra es escasa, y siguiendo con el razonamiento anterior, es el de los sucesivos filtros en el cuestionario. Siguiendo con el ejemplo anterior; a aquellas personas que fueron al cine, se les quiere preguntar además la sala a la que acudió. A priori ya se puede saber que no todas las personas de la muestra habrán acudido al cine. En este ejemplo concretamente son el 16,4%, o lo que es lo mismo, 63 encuestas. Con esta submuestra, difícilmente se podrán hacer estimaciones sólidas de cuál es la cuota de mercado de cada una de las salas de la ciudad.

En conclusión, a la hora de determinar el tamaño de la muestra, hay que prever los análisis que se van a realizar, y las posibles pérdidas de muestra que se producirán en caso de haber filtros en el cuestionario (filtros: preguntas que dan pie a que unos encuestados sigan respondiendo determinadas preguntas y otros no porque no están cualificados para ello). A su vez, existen estudios donde el margen de error debe ser mínimo; no es lo mismo un estudio de opinión donde un margen de error de 5% es más que aceptable, que un estudio electoral.

Las fórmulas para calcular el tamaño de las muestras son diversas, basadas todas ellas en las fórmulas para la estimación del error muestral, ya sea de la proporción, de la media o de la desviación típica.

Dos de las más habituales son las siguientes:

Para muestras finitas:

Para muestras infinitas:

N es el número de individuos que forman el universo.

n es el número de individuos de la muestra.

P y Q son una medida de dispersión de la muestra.

Si no existe información suficiente de la muestra a analizar, se presupone la mayor dispersión (p=0,5 y q=0,5). Resulta evidente pensar que si la población que se va a estudiar es muy homogénea en la variable de análisis, la muestra necesaria será menor. Por ejemplo, en una localidad en la que sólo concurren 2 partidos a las elecciones, y uno ha ganado las últimas celebradas hace 1 mes con un porcentaje de los votos del 90% frente al 10%. Por simplificar el ejemplo, no se produce abstención. Ahora, se quiere conocer cuales serían los resultados de una nueva elección. Por tratarse de una población muy homogénea, no se precisará de tanta muestra. El mayor problema es que en investigación comercial pocas veces se cuenta con una medida de dispersión poblacional suficientemente actualizada.

k o son el nivel de confianza que se pretende conseguir, pero en unidades estandarizadas. Lo habitual es utilizar un 95% de nivel de confianza, lo que significa un de 1,96.

e es el error muestral máximo que se desea cometer. Como norma general, no es recomendable trabajar en el total con errores superiores al 5%.

Establecer el mecanismo para la selección de los encuestados. Dentro de los procedimientos de muestreo, se pueden distinguir dos grandes familias:

1. Los muestreos probabilísticos: muestreo aleatorio simple, estratificado óptimo...

2. Los muestreos no probabilísticos: muestreo por cuotas, bola de nieve...

¿Qué los diferencia? La clave para ver la diferencia, por lo menos a nivel teórico, es la disponibilidad y utilización de una base de sondeo. La base de sondeo es un documento, tipo censo, en el que aparecerían consignados todos los individuos que configuran el universo. Al disponer de él con anterioridad a la selección, se supone que se pueden establecer mecanismos totalmente aleatorios para la selección de los encuestados o lo que es lo mismo, se puede garantizar que todos los individuos tienen la misma probabilidad de formar parte de la muestra. Es decir, sólo cuando se dispone de base de sondeo se puede garantizar la aleatoriedad en la selección de los individuos que configuraran la muestra, y sólo en estos casos estaremos ante un método probabilístico. Por tanto, en sentido estricto, sólo en los casos de utilización de muestreo probabilístico en cualquiera de sus variantes, se podrán hacer estimaciones de parámetros, es decir proyectar los datos a nivel poblacional, porque sólo en caso de muestreo aleatorio, se puede determinar el error muestral.

Así, en el caso más simple de muestreo aleatorio, se le otorgaría a cada individuo un número, y mediante una urna, o un generador de números aleatorios, se determinaría quienes serían los elementos poblaciones a encuestar. Sin embargo, esto plantea sus problemas ¿qué sucede cuando no es posible localizar a un elemento de la muestra? Para este tipo de inconvenientes se establecen soluciones como fijar un número de intentos antes de proceder al reemplazo mediante mecanismos aleatorios.

Pero en ocasiones no se dispone de una base de sondeo. Por ejemplo, si se trata de estudiar la opinión de los clientes de estancos, no existe ningún listado de clientes de este tipo de establecimientos. En estos casos hay que recurrir a muestreos accidentales, opináticos o por cuotas. Al no disponer de base de sondeo, no se puede garantizar la total aleatoriedad en la selección de entrevistados, por tanto no se podrán inferir parámetros. La estricta teoría estadística así lo diría. De hecho, el muestreo por cuotas, que es el más frecuente de todos los muestreos padecería de estos inconvenientes. Sin embargo, la práctica viene a demostrar que si se observan las cuotas de manera adecuada, se obtienen resultados similares a los obtenidos mediante procedimientos aleatorios.

Si bien vamos a explicar brevemente algunos ejemplos prácticos de muestreo, queremos huir de definiciones excesivamente teóricas de los mismos, porque para ello existen otros manuales más adecuados, como los editados en los Cuadernos Metodológicos del CIS. En cualquier caso también entendemos necesario dedicarle unos párrafos a este muestreo por cuotas, que si bien no es el más aclamado desde la ortodoxia metodológica, es el más habitual por ajustarse a los medios habitualmente disponibles.

Muestreos Probabilísticos:

o Aleatorio Simple

o Aleatorio Sistemático

o Aleatorio Estratificado

o Aleatorio por Conglomerados

o Polietápico

Muestreos No Probabilísticos:

o Por Cuotas

o De Conveniencia

o De Bola de Nieve

Métodos de muestreo probabilísticos

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad.

Es decir, aquellos en los que todos los individuos tienen la misma probabilidad conocida y no nula de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída para un nivel de confianza y margen de error prestablecido.

Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

1.- Muestreo Aleatorio Simple

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, tiene poca utilidad práctica cuando la población que estamos manejando es muy grande. Es el prototipo de muestreo por su sencillez y fiabilidad para calcular los errores de muestreo (en la ficha técnica de muchas encuestas se pone el error de un Muestreo Aleatorio Simple cuando en realidad se trata de otro tipo de muestreo).

2.- Muestreo Aleatorio Sistemático

En primer lugar, es necesario listar a todos los individuos de la muestra, asignándole un número a cada uno. Se elige un número aleatorio comprendido entre el número de l primer y el último individuo, ambos incluidos. Es el número de arranque. Por

...

Descargar como (para miembros actualizados) txt (32 Kb)

Leer 20 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com