ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Estadistica


Enviado por   •  7 de Junio de 2015  •  6.548 Palabras (27 Páginas)  •  617 Visitas

Página 1 de 27

1.1 MUESTREO

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población.

El muestreo es lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población.

La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población

que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta.

Los errores más comunes que se pueden cometer son:

1.-Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo.

2.-Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomo la muestra. Error de Inferencia.

En la estadística se usa la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio y el término muestra se usa para describir una porción escogida de la población.

1.1.1 Tipos de muestreo: aleatorio simple, sistemático, por estratos y por conglomerados.

Los tipos más comunes de técnicas de muestreo aleatorios son:

•el muestreo aleatorio simple,

• el muestreo estratificado,

• el muestreo por conglomerados y

• el muestreo sistemático.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Ejemplo 1

Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de estadística de 20 alumnos. Las combinaciones se escriben 20C5 lo que da el número total de formas de elegir una muestra no ordenada y este resultado es igual a 15,504 maneras diferentes de tomar la muestra. Un procedimiento simple para elegir una muestra

aleatoria sería escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y después extraer cinco papeles al mismo tiempo.

Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una tabla de números aleatorios. Se puede construir la tabla usando una calculadora o una computadora o con métodos de selección al azar.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico, imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas nacionales de opinión

sobre productos o sobre elecciones presidenciales, sería muy costoso o

tardado.

El muestreo estratificado requiere de separar a la población según grupos que no se traslapen llamados estratos, y de elegir después una muestra aleatoria simple en cada

estrato. La información de las

muestras aleatorias simples de cada estrato constituiría entonces una muestra global.

Ejemplo 2

Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran universidad. Puede ser difícil obtener una muestra con todos los profesores, así que supongamos que elegimos una muestra aleatoria de cada colegio, o departamento académico; los estratos vendrían a ser los colegios, o departamentos académicos.

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades heterogéneas entre sí de la población llamadas conglomerados.

Cada elemento de la población pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogéneos o disímiles.

Ejemplo 3

Suponga que una compañía de servicio de televisión por cable está pensando en abrir una sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por

conglomerados.

El muestreo sistemático es una técnica de muestreo que requiere de una selección aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida usando algún sistema o regla.

Ejemplo 4

Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede obtenerse primero una muestra aleatoria de los números de las páginas del directorio telefónico; al elegir el vigésimo nombre de cada página obtendríamos un muestreo sistemático, también podemos escoger un nombre de la primera página del directorio y después seleccionar cada nombre del lugar número cien a partir del ya seleccionado.

En este caso, podríamos seleccionar un número al azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente.

1.2 DISTRIBUCIONES MUESTRALES

Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muéstrales.

Con el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido.

Como los valores de un estadístico, tal como la media, varían de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias. La distribución de frecuencia de un estadístico muestral se denomina distribución muestral.

En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño.

1.2.1 DISTRIBUCIÓN MUESTRAL DE MEDIAS: SIN REMPLAZO Y CON REEMPLAZO.

Si recordamos a la distribución normal, esta es una distribución continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica.

Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la variable aleatoria, mediante la siguiente fórmula:

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribución z.

Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño de una población normal, la distribución muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal con y , entonces la fórmula para calcular la probabilidad del comportamiento del estadístico, en este caso la media de la muestra , quedaría de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo:

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.

Solución:

Este valor se busca en la tabla de z

La interpretación sería que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.

Ejemplo:

Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:

a. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.

b. El número de medias muestrales que caen por debajo de 172 centímetros.

Solución:

Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso.

a.

(0.7607)(200)=152 medias muestrales

b.

(0.0336)(200)= 7 medias muestrales

1.2.2 CALCULO DEL ERROR ESTÁNDAR.

La desviación estándar de la distribución muestral de un estadístico se conoce como error estándar del estadístico. Con esto se puede demostrar que si de una población se eligen muestras de tamaño n con reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la distribución de los errores muéstrales.

En general se tiene:

Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la formula siguiente para encontrar x .

donde es la desviación estándar de la población de donde se toman las muestras, n es el tamaño de la muestra y N el de la población.

Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población es al menos 20 veces el tamaño de la muestra (N 20), entonces se puede usar la fórmula.

El factor se denomina factor de corrección para una población finita.

Ejemplo:

Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres maestros universitarios de matemáticas:

Maestro de matemáticas Antiguedad

A 6

B 4

C 2

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la desviación estándar de la distribución muestral.

Solución:

Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2, con sus respectivas medias muestrales.

Muestras Antigüedad Media Muestral

A,B (6,4) 5

A,C (6,2) 4

B,C (4,2) 3

La media poblacional es:

La media de la distribución muestral es:

La desviación estándar de la población es:

El error estándar o la desviación estándar de la distribución muestral es:

Si utilizamos la fórmula del error estándar sin el factor de correción tendriamos que:

Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección obtendremos el valor correcto:

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error estándar:

1.2.3 EL TEOREMA DEL LÍMITE CENTRAL

Sabemos que la distribución de la media muestral de una variable normal o bien tiene distribución normal o bien se corresponde con una t de Student.

También hemos visto que si las variables originales siguen una distribución de Bernoulli, entonces su media es una proporción y, en este caso, cuando n es lo bastante grande, su distribución muestral también es una normal.

El último resultado es cierto sea cual sea la distribución de los datos originales.

Es decir, no es preciso que partamos ni de distribuciones normales ni de distribuciones de Bernoulli, ya que para muestras de tamaños lo bastante grandes, la distribución de la media muestral es normal sea cual sea la distribución original. Este resultado fundamental de la estadística tiene un nombre propio: el teorema del límite central.

Dada cualquier variable aleatoria con esperanza μ y para n lo bastante grande, la distribución de la variable es una normal estándar.

1.2.4 Distribuciones muestrales de proporciones.

Si se seleccionan muestras aleatorias de n observaciones de una población con media y desviación estándar , entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con una media igual a y una desviación estándar de . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.

Ejemplo

Para la distribución muestral de medias del ejercicio pasado, encuentre:

a. El error muestral de cada media

b. La media de los errores muéstrales

c. La desviación estándar de los errores muéstrales.

Solución:

a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muéstrales:

Muestra x Error muestral, e=x-

(0,0) 0 0 - 3 = -3

(0,2) 1 1 - 3 = -2

(0,4) 2 2 - 3 = -1

(0,6) 3 3 – 3 = 0

(2,0) 1 1 – 3 = -2

(2,2) 2 2 – 3 = -1

(2,4) 3 3 – 3 = 0

(2,6) 4 4 – 3 = 1

(4,0) 2 2 – 3 = -1

(4,2) 3 3 – 3 = 0

(4,4) 4 4 – 3 = 1

(4,6) 5 5 – 3 = 2

(6,0) 3 3 – 3 = 0

(6,2) 4 4 – 3 = 1

(6,4) 5 5 – 3 = 2

(6,6) 6 6 – 3 = 3

b. La media de los errores muestrales es e, es:

c. La desviación estándar de la distribución de los errores muestrales

e, es entonces:

1.2.4 DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del estadísitico media.

Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np 5 y

n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de intentos.

Generación de la Distribución Muestral de Proporciones

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de proporciones para el número de piezas defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas.

El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artículos Buenos Artículos Malos Proporción de artículos defectuoso Número de maneras en las que se puede obtener la muestra

1 4 4/5=0.8 8C1*4C4=8

2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es igual a la Proporción de la población.

p = P

También se puede calcular la desviación estándar de la distribución muestral de proporciones:

La varianza de la distribución binomial es 2= npq, por lo que la varianza de la distribución muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores en esta fórmula tenemos que:

, este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de corrección para una población finita y un muestreo sin reemplazo:

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de proporciones está basada en la aproximación de la distribución normal a la binomial . Esta fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la muestra.

A esta fórmula se le puede agregar el factor de corrección de si se cumple con las condiciones necesarias.

Ejemplo:

Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solución:

Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral de proporciones.

Aproximación de la distribución normal a la binomial:

Datos:

n=800 estudiantes

p=0.60

x= (.55)(800) = 440 estudiantes

p(x< 440) = ?

Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribución Muestral de Proporciones

Datos:

n=800 estudiantes

P=0.60

p= 0.55

p(p< 0.55) = ?

Observe que este valor es igual al obtenido en el método de la aproximación de la distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo entre el tamaño de la muestra, ya que estamos hablando de una proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.

Ejemplo:

Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%.

a. Resolverlo mediante la aproximación de la normal a la binomial

b. Resolverlo con la distribución muestral de proporciones

a. Aproximación de la distribución normal a la binomial:

Datos:

n=150 personas

p=0.03

x= (0.04)(150) = 6 personas

p(x>6) = ?

Media = np= (150)(0.03)= 4.5

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarán una reacción adversa.

b. Distribución Muestral de Proporciones

Datos:

n=150 personas

P=0.03

p= 0.04

p(p>0.04) = ?

Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa.

2.1 CONCEPTOS Y TIPOS DE ESTIMACIÓN DE PARAMETROS:

ESTIMACION:

El proceso de estimación en inferencia estadística puede ser descrito como el proceso de estimar un parámetro a partir del estadístico correspondiente, tal como usar una media muestral (Estadístico) para estimar la media poblacional, (parámetro).

La estimación de parámetros puede ser:

• Puntual o Por Punto.

• Por Intervalo.

2.1.1 ESTIMACIÓN PUNTUAL:

Objetivo.

Dar un valor numérico que aproxime en forma muy cercana al parámetro poblacional.

La estimación puntual de un parámetro de una población es un solo valor numérico de un estadístico que corresponde a este parámetro.

Un estadístico utilizado para aproximar a un parámetro de una población se denomina Estimador del Parámetro. El número obtenido cuando se evalúa el estimador para una muestra particular, se denomina Estimación del Parámetro.

Sea X una variable aleatoria de interés con distribución de probabilidad f (x).

θ : Parámetro Desconocido.

: f (X1, X2, X3,…,Xn)

m. a. de tamaño n.

Estadístico.

Estimador.

Por ejemplo: es un posible estimador de µ.

µ = θ

: : Estimador puntual de µ, porque al evaluarlo para una muestra es concreto, da un solo numero o punto.

: Estimación puntual de µ.

Otros Parámetros de Interés:

P: Proporción Poblacional (proporción binomial).

“Proporción de elementos con cierta característica de interés en un universo dado.”

= Estimador puntual de P.

X: Nº de elementos en la muestra con característica de interés.

σ2 : Varianza Poblacional.

Estadístico: Estimador puntual de σ2.

σ : Desviación estándar de una población.

Estimador puntual de σ.

µ1 - µ2: Diferencia de dos medias poblacionales.

Estimador puntual de µ1 - µ2.

Diferencia entre las medias de dos muestras aleatorias independientes.

P1 – P2

Estimador puntual para P1 – P2

Diferencia entre dos proporciones muéstrales, basadas en dos muestras aleatorias independientes.

Razón de dos varianzas poblacionales.

Estimador puntual de

Sea X una variable aleatoria con media µ desconocida y varianza σ2.

X1, X2,…, Xn m. a. de tamaño n.

θ = µ

= f (X1, X2,…, Xn)

Estimadores posibles para µ

¿Cuál es el mejor?

Antes de responder a esta pregunta debemos decidir que propiedades son deseables en un estimador puntual.

Obviamente queremos que el estimador produzca estimaciones que puedan esperarse sean próximas en valor al parámetro que se esta estimando.

Propiedades De Los Estimadores Puntuales:

• Insesgabilidad

• Eficiencia

• Consistencia

• Suficiencia

Estimador In sesgado:

Sea un estimador puntual de un parámetro θ, entonces es un estimador insesgado si E ( ) = θ. De lo contrario se dice que es sesgado.

Distribución muestral de un estimador insesgado.

Distribución muestral de un estimador sesgado positivamente, para el cual

Si el estimador es sesgado, la magnitud del sesgo es:

Sesgo =

Suponga que X es una variable aleatoria con media µ y varianza σ2, sea X1, X2, X3, X4,…, Xn una m. a. de tamaño n de X. Es posible probar que la media muestral y la varianza muestral S2 son estimadores insesgados de µ y σ2 respectivamente.

Sin embargo S1 (Desviación estándar muestral) es un estimador sesgado de σ. (σ: Desviación estándar poblacional).

Error estándar de un estimador de un parámetro θ.

Medida usual de la precisión de una estimación puntual.

Error cuadrado medio (ECM) de un estimador .

Se puede demostrar que:

Si es un estimador puntual insesgado de θ; entonces:

Ya que el sesgo

Varianza de

Error de estimación.

El error de estimación Є es la distancia entre el estimador y su parámetro. Es decir;

= f (X1, X2,…, Xn)

m. a.

Є Cantidad aleatoria.

Nota: La condición de que es insesgado, supone que el valor promedio de (promedio de los valores de ) es exactamente correcto. No dice que un solo valor sea exactamente correcto.

Eficiencia Relativa: La eficiencia relativa entre dos estimadores y de un parámetro θ, con ECM respectivos ECM ( ) y ECM ( ) se define como:

Si la eficiencia relativa es menor que 1 entonces concluimos que es un mejor estimador de θ que

Si y son dos estimadores insesgados de θ, entonces:

Eficiencia Relativa =

Si consideramos todos los posibles estimadores insesgados de algún parámetro θ, el de menor varianza se llama Estimador mas Eficiente de θ.

Estimador Consistente:

Si es un estimador insesgado de θ, basado en una m. a. de tamaño n, decimos que es consistente para θ, si:

La consistencia es una propiedad de muestras grandes.

Los estimadores cuyo ECM (o varianza si el estimador es insesgado) tiende a cero cuando el tamaño de la muestra tiende al infinito, son consistentes.

Por ejemplo:

Si X N (µ, σ2) y X1, X2,…, Xn

Es una muestra aleatoria de tamaño n de X, entonces es un estimador consiente de µ.

Es un estimador insesgado de µ.

2.1.2 ESTIMACIÓN POR INTERVALO.

Un estimador por intervalo es una regla que especifica un método que utiliza las mediciones de la muestra para calcular dos números que forman los extremos del intervalo.

Objetivo:

Encontrar un estimador por intervalo que genere intervalos angostos que contengan a θ (parámetro) con una alta probabilidad.

Los estimadores por intervalo se denominan comúnmente intervalos de confianza.

Un intervalo de confianza de θ, es un intervalo [L, U] que incluye a θ con un grado de certidumbre establecido.

L y U se denominan extremos inferior y superior del intervalo de confianza.

L: Limite inferior de confianza.

U: Limite de confianza superior.

L, U: Estadísticos (variables aleatorias).

Para construir un estimador por intervalo del parámetro θ desconocido, debemos encontrar L y U tal que:

P (L ≤ θ ≤ U) = 1 – α

La probabilidad 1 – α se le llama Coeficiente de Confianza. Usualmente, se expresa en porcentaje: 100 (1 – α) %.

1 – α es la probabilidad de que el intervalo contenga al parámetro.

0 < α < 1

El intervalo resultante:

L ≤ θ ≤ U

Se llama intervalo de confianza del 100 (1 – α) % para el parámetro θ. (Intervalo de confianza de dos lados).

En ocasiones un intervalo de confianza de un lado podría ser útil.

L ≤ θ Intervalo de confianza inferior del 100 (1 – α) %.

θ ≤ U Intervalo de confianza superior del 100 (1 – α) %

Donde U se elige de modo que:

P (θ ≤ U) = 1 - α

2.2 CONCEPTO Y CALCULO DE UN INTERVALO DE CONFIANZA.

En una estimación paramétrica, el intervalo de confianza [a, b] debe contener en su interior a la media de la población m con una probabilidad igual a 1 - a, expresión que se conoce como nivel de confianza. Es decir:

2.2.1 ESTIMACIÓN POR INTERVALO DE µ.

Intervalo de confianza sobre la media (µ), conocida la varianza (σ2).

Construir un intervalo de confianza del 100 (1 – α) % para la media µ de una población denotada por X, con varianza σ2 conocida a partir de una muestra aleatoria (m. a.) X1, X2, X3,…, Xn de tamaño n.

Si usamos como estimador puntuales de µ.

Distribución de .

• Si la muestra es seleccionada de una población normal.

De donde:

• A falta de esta (De población normal), si n es suficiente grande:

* Si se cumplen las condiciones del TLC.

Aproximadamente.

Aproximadamente.

Para construir un intervalo de confianza de µ, primero hallaremos una variable aleatoria (v. a.) cuya expresión contenga a µ y cuya distribución se conozca al menos aproximadamente.

Nótese que la v. a. Contiene al parámetro µ y su distribución es normal

estándar (o al menos aproximadamente normal estándar).

Queremos determinar L y U de forma que P (L ≤ θ ≤ U) = 1 – α

Consideremos la participación de la curva normal estándar.

Formula exacta cuando la población muestreada tiene distribución normal y varianza σ2 conocida.

• Si σ2 no se conoce (y σ) reemplazar σ por S en (I). Buena aproximación, siempre que n sea grande (n ≥ 30).

Intervalo de confianza sobre la medida (μ), σ2 desconocida, muestra pequeña.

Suponer:

• Población normal con medida μ y σ2 (varianza) desconocida.

X N (μ, σ2)

• Muestra aleatoria de tamaño n.

X1, X2,… Xn

Media Muestral

Varianza Muestral

• n pequeña (< 30).

Construir un intervalo de confianza del 100 (1 – α) % para μ.

Estimador puntual de μ

Reacomodando:

P (L ≤ θ ≤ U) = 1 – α

Intervalo de confianza de dos lados del 100 (1 – α) % para μ.

Donde es el valor t con n – 1 grados de libertad que deja una área de a la derecha.

A la formula anterior a menudo se le denomina formula del intervalo de confianza para la media en muestras pequeñas, aunque es valido para muestras de cualquier tamaño.

Intervalo de confianza de un lado del 100 (1 – α) % en μ.

2.2.2 ESTIMACIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS.

• Puntual.

• Por intervalo.

Considérese dos poblaciones con medias μ1 y μ2 y varianzas σ12 y σ22 (conocidas) respectivamente. Dos muestras aleatorias independientes de tamaño n1 y n2 son seleccionadas, una de dada población.

Un estimador lógico de μ1- μ2 es donde son las medidas muéstrales.

X11, X12,.......X1n1 m.a de tamaño n1 de X1.

X21, X22,…X2n2 m.a de tamaño n2 de X2.

X1 y X2 denotan las poblaciones de interés.

;

Estimador puntual de μ1- μ2.

El valor numérico es la estimulación puntual de μ1- μ2.

La distribución maestral de es normal si X1 y X2 están distribuidas de forma normal o aproximadamente normal si se completa las condiciones del TLC.

La distribución de la v.a Z es normal estimada; si X1 y X2 son normales o aprox. Normal estándar si n1 y n2 son grandes (TLC).

De donde:

Sustituyendo Z:

Aislar algebraicamente μ1- μ2 del centro de la desigualdad:

De donde:

*intervalo de confianza aproximado a menos que las dos poblaciones sean normales.

La forma del intercambio anterior se aplica si se conocen σ12 y σ22. Si las varianzas no se conocen y las dos poblaciones son normales, la distribución t resulta implicada como en el caso de una muestra. Si no esta dispuesto a suponer normalidad muestras grandes (≥ 30) permitirán el uso de S12 y S22 respectivamente.

2.2.3 INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN P

Supóngase que estamos interesados en estimar la proporción P de elementos que presentan la característica de interés en un universo dado. Una muestra aleatoria de tamaño n es seleccionada al azar y se observa el numero de elementos X (x≤n) en la muestra que tiene la característica de interés.

Sabemos que:

Cuando n es grande (?)

Aproximadamente.

Estandarizando:

Aproximadamente

Dividiendo numerador y denominador entre n, tenemos:

Estimador puntual de P

Es un estimador integrado de P.

V.a a utilizar para construir el intervalo de confianza del 100 (1-α) % para P

Considerando la partición de la curva normal estándar, tenemos:

Pero:

Reacomodando:

Al sustituir P por en el error estándar (lo que resulta un error estándar estimado) tenemos que: El intervalo de coeficiente bilateral del 100 (1 – α) % aproximado en P es:

2.2.4 INTERVALO DE CONFIANZA A PARTIR DE DOS PROPORCIONES MUÉSTRALES.

P1 – P2 Parámetro.

P1: Proporción de elementos con la característica de interés en un universo dado.

P2: Proporción de elementos con la característica de interés en otro universo dado.

Si bien se trata de dos universos diferentes, la característica de interés deberá ser la misma.

P1 y P2 son parámetros binomiales.

Si toman muestras aleatorias independientes de tamaño n1 y n2 respectivamente.

X1: Nº de elementos en la muestra 1 con la característica de interés.

X2: Nº de elementos en la muestra 2 con la característica de interés.

Un estimador lógico de P1 – P2 es:

Es posible probar que:

Se puede construir un intervalo de confianza para P1 – P2 considerando la distribución muestral de :

Distribución muestral de :

Para n1 y n2 grandes.

De donde:

De la curva normal estándar podemos escribir:

Sustituyendo para Z.

Reareglando:

De donde un intervalo de confianza de dos lados del 100 (1 – α) % aproximado para P1 – P2 es:

La construcción del intervalo de confianza para P1 – P2 se basa en la aproximación normal a la binomial que es adecuada para n1 y n2 grandes. ¿ ?

2.3 DETERMINACIÓN Y TAMAÑO DE LA MUESTRA

En general, cuanto más estrecho es un intervalo de confianza mayor precisión tendrá nuestra estimación (será menor el error muestral máximo). Ahora bien, la amplitud de un intervalo depende de dos factores: el nivel de confianza que decidimos utilizar y el tamaño del error típico (es la desviación típica) del estadístico utilizado como estimador.

Si disminuimos el nivel de confianza, diminuye la amplitud del intervalo, pero aumenta el riesgo. Debemos intentar reducir la amplitud del intervalo manteniendo constante el nivel de confianza; para ello hay que reducir el error típico del estimador.

En el caso de la media, el error típico es . Por lo tanto, variando el tamaño muestral variaremos el error típico. Al aumentar n, disminuye . Por tanto, manipulando el tamaño de la muestra podemos obtener los intervalos de la precisión que deseemos.

2.3.1 PARA LA MEDIA:

2.3.2 PARA LA PROPORCIÓN:

Ejemplo: Queremos estimar la media de una población normal con varianza poblacional igual a 4. ¿qué tamaño muestral debemos tomar para que E=0'02 al nivel de confianza 0'95?

Como conocemos la varianza poblacional, el tamaño muestral será:

=

¿y si queremos un error E=1 al mismo nivel de confianza? En este caso

= . Redondeamos n=16.

2.3.2 SOLO VERLO CON EL MODELO NORMAL ESTÁNDAR, PARA MUESTRAS GRANDES N>30

Para muestras grandes (n≥30), la distribución de muestreo está, muy aproximadamente, normalmente distribuida. Nótese que la población está binomialmente distribuida. La ecuación (3) es válida también para una población finita en la que se hace muestreo con reposición. Para poblaciones finitas en que se haga muestreo sin reposición, la ecuación (3) queda sustituida por la ecuación:

μ = p y σ= √p q σp= √p q = √p(1−p)

---- -------

n n

BIBLIOGRAFIA:

http://www.itch.edu.mx/academic/industrial/estadistica1/cap01b.html

http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf

http://es.slideshare.net/lupitajesus/estimacin-1194099?from_action=save

http://www.calidad.com.mx/docs/art_64_1.pdf

http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf

http://www.spentamexico.org/v4-n1/4%281%29%20149-178.pdf

http://www.hiru.com/matematicas/intervalos-de-confianza

...

Descargar como  txt (36.6 Kb)  
Leer 26 páginas más »
txt