ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Apuntes De Estadistica


Enviado por   •  12 de Abril de 2013  •  2.661 Palabras (11 Páginas)  •  380 Visitas

Página 1 de 11

TEMA 1: CONCEPTOS BÁSICOS DE MUESTREO

1.1 INTRODUCCIÓN

POBLACIÓN:

Es el marco obligado de referencia para cualquier estudio estadístico sea cual sea su tipo y finalidad.

Conjunto de personas o cosas a las que va dirigida la investigación.

La población objeto de estudio está compuesta de:

Elementos: cada una de las personas o cosas que integran la población.

Los elementos poseen ciertos Caracteres (cualidades o propiedades) que son el objeto de estudio de la investigación. (Ej. personas: sexo, edad, peso, estatura, religión…)

El Tamaño de la población (N) será el número de elementos que contiene.

CARACTERES:

VARIABLES: (Cuantitativos) expresados mediante números (estatura, peso…). Los diferentes valores de una variable son las observaciones.

ATRIBUTOS: (Cualitativos) se describen por palabras (profesión, estudios, nacionalidad…). Son modalidades o categorías las distintas presentaciones de un mismo atributo.

VARIABLES:

Discretas: Sólo puede tomar valores enteros. (Ej. Nº de hijos por mujer) . Entre dos valores cualquiera solo podrá aparecer un número finito de valores.

Continuas: puede tomar cualquier valor real. (Ej. Estatura de los individuos). Habrá infinitos valores.

ATRIBUTOS:

Ordinales: Se puede establecer el orden entre las distintas modalidades. (Ej. Nivel de estudios: 1. Primarios, 2. Secundarios, 3. Universitarios…)

Nominales: No se puede establecer ningún orden entre las modalidades. (Ej. Color de ojos: negros, marrones, azules, verdes…) No hay jerarquización posible.

En las investigaciones estadísticas se pueden observar:

Los caracteres en todos los elementos que constituyen la población: Observación exhaustiva.

Sólo algunos caracteres determinados o solo en una parte de la población: Observación parcial.

Motivos de la Observación parcial:

Tamaño de la población (N) muy grande.

Tiempo a emplear > tiempo disponible para el estudio.

Coste de investigar el total de los elementos > presupuesto.

MUESTRA:

Cuando por cualquiera de las razones expuestas solo se investiga una parte de la población.

Se tiene que tratar de tomar como muestra los elementos más representativos del conjunto de la población.

A veces recurrimos a métodos o procedimientos aleatorios para seleccionarla, así se conseguirá una mayor representatividad.

Al observar el carácter se tengan que destruir los elementos (Ej. Duración de un lote de bombillas).

1.2 DIFERENTES TIPOS DE MUESTREO

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

I. MUESTREO PROBABILÍSTICO

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

1.- MUESTREO ALEATORIO SIMPLE:

El procedimiento empleado es el siguiente:

1) Se asigna un número a cada individuo de la población y 2) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

2.- MUESTREO ALEATORIO SISTEMÁTICO:

Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.

El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

3.- MUESTREO ALEATORIO ESTRATIFICADO:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.

Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.

4.- MUESTREO ALEATORIO POR CONGLOMERADOS:

Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales.

En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

II. MÉTODOS DE MUESTREO NO PROBABILÍSTICOS

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos.

En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos:

1.- MUESTREO POR CUOTAS:

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

2.- MUESTREO INTENCIONAL O DE CONVENIENCIA:

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).

3.- BOLA DE NIEVE:

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

4.- MUESTREO DISCRECIONAL ·

A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

1.3 ETAPAS DEL ESTUDIO POR MUESTREO:

1.3.1 Definición de objetivos:

Esta etapa comprende la identificación del problema y el establecimiento de las metas del estudio.

1.3.2 Definición del marco de muestreo;

El marco de muestreo es el conjunto de las unidades de muestreo que constituyen una población. Este generalmente puede ser de dos tipos:

a) Marco lista: Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad de muestreo. Por ejemplo, una lista que contenga el nombre de todos los proveedores de caña de azúcar de un ingenio. Es recomendable que además de identificar a cada unidad muestral, incluya algunas otras características de interés, por ejemplo, tamaño de la finca de cada proveedor.

b) Es un plano o mapa que permite identificar pequeñas áreas usadas como unidades de muestreo en las que se ha dividido el área total.

1.3.3 Variables a medir y Métodos de medición:

Es importante considerar el tipo de variable a medir, por ejemplo: si se va a estudiar el rendimiento de caña de azúcar, la variable es de tipo continuo, si interesa estimar la proporción de agricultores que utilizan herbicidas para el control de malezas, se medirá una variable de tipo binomial. El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo.

Los métodos de medición deben de tener las siguientes características:

Uniformidad.

Practicabilidad.

Deber ser comprensibles para el grupo de trabajo.

1.4 DISTRIBUCIONES MUESTRALES:

Considerando todas las posibles muestras de tamaño “N” en una población dada, cada muestra tendrá un estadístico (su media y su desviación típica) diferente en cada uno. A esta distribución del estadístico se le llama “Distribución del muestreo”.

Por ejemplo si el estadístico que consideramos es la “media muestral” su distribución se llamará “Distribución del muestreo de medias”.

1.4.1 DISTRIBUCIÓN DEL MUESTREO DE MEDIAS:

Si tomamos todas las posibles muestras de tamaño “N” (sin reposición) de una población finita donde Np>N; entonces:

La media de la distribución de medias: μ_X (Media muestral)

La desviación típica de la distribución del muestreo de medias:σ_X (Desviación Típica muestral)

Media poblacional μ

Desviación típica poblacional σ

Para el caso de población finita:

μ_X=μ

σ_X=σ/√N √((N_p-N)/(N_p-1))

Para el caso de población infinita o muestreo con reposición:

μ_X=μ

σ_X=σ/√N

Cuando el tamaño de la muestra (N>30) es grande, la distribución del muestreo de medias tiende a una normal cuya media es μ_X y cuya desviación típica es σ_X; N (μ_X,σ_X).

1.4.2 DISTRIBUCIÓN DEL MUESTREO DE PROPORCIONES:

Para el caso de una población finita:

p=probabilidad de éxito de un suceso

q=probabilidad de fracaso de un suceso

N=tamaño muestral de la población

μ_p=media muestral

σ_p=√(pq/N)=√((p(1-p))/N)

Para valores grandes N>30 la distribución del muestreo de medias está normalmente distribuida.

Para el caso de una población finita con muestreo con reposición:

μ_p=p

σ_p=√(pq/N)=√((p(1-p))/N)

Para el caso de una población finita con muestreo sin reposición:

μ_p=p

σ_p=√pq

1.4.3 DISTRIBUCIONES DE MUESTREO DE DIFERENCIAS Y SUMAS

Sean dos poblaciones:

N_1=muestra de la población 1

S_1=Estadístico de la población 1

μ_1=media del estadístico de la población 1

σ_1=Desviación típica del estadístico de la población 1

N_2=muestra de la población 2

S_2=Estadístico de la población 2

μ_2=media del estadístico de la población 2

σ_2=Desviación típica del estadístico de la población 2

1.4.4 LA DISTRIBUCIÓN DE LA DIFERENCIA CUANDO LAS MEDIAS SON INDEPENDIENTES:

〖La media de la distribución del muestreo de la diferencia de medias es: μ〗_(S_1-S_2 )

La desviación típica de la distribución del muestreo de la diferencia de medias es: σ_(S_1-S_2 )

μ_(S_1-S_2 )=μ_(S_1 )-μ_(S_2 )

σ_(S_1-S_2 )=√(σ_(S_1)^2+σ_(S_2)^2 )

DISTRIBUCIÓN DEL MUESTREO DE LA DIFERENCIA DE MEDIAS CON POBLACIONES INFINITAS Y FINITAS CON REPOSICIÓN:

Medias poblacionales: μ_1 y μ_2

Desviación típica poblacionales: σ_1 y σ_2

μ_(X_1-X_2 )=μ_(X_1 )-μ_(X_2 )=μ_1-μ_2

σ_(x_1-X_2 )=√(σ_(X_1)^2+σ_(X_2)^2 )=√((σ_1^2)/N_1 +(σ_2^2)/N_2 )

DISTRIBUCIÓN DEL MUESTREO DE LA DIFERENCIA DE PROPORCIONES DE DOS POBLACIONES BINOMIALMENTE DISTRIBUIDAS:

En este caso partimos de dos parámetros: (〖(p〗_1,q_1) y (p_2,q_2)

μ_(p_1-p_2 )=μ_(p_1 )-μ_(p_2 )=p_1-p_2

σ_(p_1-p_2 )=√(σ_(p_1)^2+σ_(p_2)^2 )=√(((p_1 q_1))/N_1 +((p_2 q_2))/N_2 )

Si N1 y N2 >30 la distribución del muestreo de diferencia de medias o proporciones están casi normalmente distribuidas.

1.4.5 TEOREMA CENTRAL DEL LÍMITE:

Si se obtiene un muestra de una población normal la media muestral (μ_X) tiene una distribución normal sin importar el tamaño de la muestra.

Pero podemos demostrar que no importa cuál sea el modelo de probabilidad del que se obtenga la muestra, mientras exista la media y la varianza.

La distribución del muestreo de X (como variable aleatoria) se aproximará a una distribución normal conforme aumente “N” (la muestra)

Χ⟼N (μ,σ) TEOREMA CENTRAL DEL LÍMITE

En muchos casos la aproximación será buena si N>30.

Vamos a demostrar la validez del Teorema central del límite mediante un ejemplo:

Supongamos una población consistente en los valores: 0, 2, 4, 6, 8. Tomamos muestras de tamaño 2 con reemplazo:

X Frecuencia Frecuencia relativa X2

0 1 1/5 0

2 1 1/5 4

4 1 1/5 16

6 1 1/5 36

8 1 1/5 64

1. Calculamos la media (μ), la varianza y la desviación típica poblacional (σ):

μ=(∑_(i=1)^N▒X_i )/N

μ= ((0+2+4+6+8))/5=20/5=4

σ^2=(∑_(i=1)^N▒〖(X_i-μ)〗)/N=(∑_(i=1)^N▒〖(〖X_i)〗^2 〗)/N-μ^2=120/5-4^2=8

σ=√8=2.83

2. Dibujamos la gráfica de la distribución de frecuencias:

Esta gráfica no la podemos considerar acampanada o de Gauss (Normal)

3. Tomamos las muestras de tamaño 2 con reemplazo y calculamos las medias muestrales:

MUESTRA MEDIA MUESTRAL

(0,0) 0

(0,2) 1

(0,4) 2

(0,6) 3

(0,8) 4

(2,0) 1

(2,2) 2

(2,4) 3

(2,6) 4

(2,8) 5

(4,0) 2

(4,2) 3

(4,4) 4

(4,6) 5

(4,8) 6

(6,0) 3

(6,2) 4

(6,4) 5

(6,6) 6

(6,8) 7

(8,0) 8

(8,2) 5

(8,4) 6

(8,6) 7

(8,8) 8

4. Agrupamos las medias muestrales en una tabla de frecuencias:

Media Muestral Frecuencia

0 1

1 2

2 3

3 4

4 5

5 4

6 3

7 2

8 1

5. Calculamos la media de las medias muestrales y la desviación típica de las medias muestrales:

μ_X=((0*1)+(1*2)+(2*3)+(3*4)+(4*5)+(5*4)+(6*3)+(7*2)+(8*1))/25=100/25=4

σ_X^2=(1(0-4)^2+2(1-4)^2+3(2-4)^2+⋯+3(6-4)^2+2(7-4)^2+1(8-4)^2)/25=100/25=4

σ_X=√4=2

6. Gráfica de la distribución de frecuencias para las medias muestrales:

Tiene la apariencia acampanada de la distribución de las medias. Es razonable aproximar la distribución muestral de X ̅ a una normal (una vez conocida la media y la desviación típica de la distribución).

1.5 ESTIMACIÓN DE PARÁMETROS:

Ya sabemos cómo emplear la teoría del muestreo para obtener información sobre las muestras aleatorias extraídas en una población. Pero es más práctico poder obtener información sobre una población a partir de una serie de muestras.

Esto es la INFERENCIA ESTADÍSTICA y un problema importante de la inferencia es la Estimación de Parámetros de la Población (μ o σ^2) a partir de los Estadísticos Muestrales (μ_X ̅ o σ_X ̅ ).

1.5.2 ESTIMACIONES SIN SESGO:

Media de las distribuciones de muestreo=Media del Parámetro Poblacional→ESTADÍSITICO=ESTIMADOR SIN SESGO

→Valores del Estadísitico→ESTIMACIONES SIN SESGO

Media de las distribuciones de muestreo≠Media del Parámetro Poblacional→ESTADÍSITICO=ESTIMADOR SESGADO

→Valores del Estadísitico→ESTIMACIONES SESGADAS

Ejemplo:

La media de la distribución del muestreo de medias (μ_X ̅ ) coincide con la media poblacional(μ), por lo tanto la media muestral (X ̅) es una estimación sin sesgo de la media poblacional (μ).

1.5.3 ESTIMACIÓN EFICIENTE:

Si las distribuciones de muestreo de dos estadísticos tienen la misma media:

El de mayor varianza es el estimador EFICIENTE de la media.

El de menor varianza es el estimador INEFICIENTE de la media.

Los valores del estadístico eficiente serán la estimación eficiente y los valores del estadístico ineficiente serán la estimación ineficiente.

De entre todos los posibles estadísticos cuyas distribuciones de muestreo tienen igual media; el de menor varianza se llama ESTIMADOR MÁXIMA EFICIENTE o (Mejor Estimador).

1.5.4 ESTIMACIONES DE PUNTO Y ESTIMACIONES DE INTERVALO: FIABILIDAD.

Estimación de Punto de Parámetro: Estimación de un parámetro de la población dado por un solo número.

Estimación de Intervalo del Parámetro: Estimación de un parámetro de la población dado por dos números entre los que se puede considerar encajado el parámetro.

Las estimaciones de intervalo indican la precisión de una estimación y son preferibles a las de punto.

Ejemplo:

Una distancia se mide como 5.28 metros. (Estimación de Punto)

Una distancia se mide como 〖5.28〗_-^+ 0.03 (Estimación de Intervalo)

El margen de error (precisión) de una estimación informa sobre su fiabilidad.

...

Descargar como  txt (19.4 Kb)  
Leer 10 páginas más »
txt