Estadistica
Alheni15 de Septiembre de 2012
15.140 Palabras (61 Páginas)290 Visitas
Introducción.
El propósito principal es presentar la estadística desde el punto de vista de sus aplicaciones, sin detenerse en demostraciones ni profundizar en temas muy especializados.
En el siglo XXI no se puede concebir una investigación en las ciencias experimentales, en medicina, en las ciencias sociales, en la técnica, en la industria, que no utilice la estadística y el ordenador, que ha facilitado el cálculo y el manejo de gran cantidad de datos. El estudiante y el investigador de hoy necesitan analizar los datos que recogen en su campo de trabajo y se encuentran, en numerosas ocasiones, en situaciones de incertidumbre, lo que hace necesaria la utilización de métodos estadísticos para sacar de su estudio mejores conclusiones.
Los métodos estadísticos son de dos tipos: descriptivos e inductivos. El objeto de los descriptivos es ordenar, resumir y analizar los datos recogidos, mientras que los inductivos tratan de obtener conclusiones a partir de los datos de la muestra analizada, es decir, a partir del conocimiento de una muestra se establecen inferencias sobre la población de la que se ha obtenido dicha muestra y se contrastan.
ESTIMACIÓN DE PARÁMETROS.
En general, de las variables experimentales u observacionales no conocemos la fpd. Podemos conocer la familia (normal, binomial,...) pero no los parámetros. Para calcularlos necesitaríamos tener todos los posibles valores de la variable, lo que no suele ser posible. La inferencia estadística trata de cómo obtener información (inferir) sobre los parámetros a partir de subconjuntos de valores (muestras) de la variable.
Estadístico: variable aleatoria que sólo depende de la muestra aleatoria elegida para calcularla. Estimación: Proceso por el que se trata de averiguar un parámetro de la población representado, en general, a partir del valor de un estadístico llamado estimador y representado por
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.
El problema se resuelve en base al conocimiento de la "distribución muestral" del estadístico que se use. ¿Qué es esto? Concretemos, p.e. en la media (. Si para cada muestra posible calculamos la media muestral ( ) obtenemos un valor distinto ( es un estadístico: es una variable aleatoria y sólo depende de la muestra), habrá por tanto una fpd para , llamada distribución muestral de medias. La desviación típica de esta distribución se denomina error típico de la media. Evidentemente, habrá una distribución muestral para cada estadístico, no sólo para la media, y en consecuencia un error típico para cada estadístico.
Si se seleccionan muestras aleatorias de n observaciones de una población con media y desviación estándar , entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con una media igual a y una desviación estándar de . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.
Ejemplo
Para la distribución muestral de medias del ejercicio pasado, encuentre:
a. El error muestral de cada media
b. La media de los errores muestrales
c. La desviación estándar de los errores muestrales.
Solución:
a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:
Muestra x Error muestral, e=x-
(0,0) 0 0 - 3 = -3
(0,2) 1 1 - 3 = -2
(0,4) 2 2 - 3 = -1
(0,6) 3 3 – 3 = 0
(2,0) 1 1 – 3 = -2
(2,2) 2 2 – 3 = -1
(2,4) 3 3 – 3 = 0
(2,6) 4 4 – 3 = 1
(4,0) 2 2 – 3 = -1
(4,2) 3 3 – 3 = 0
(4,4) 4 4 – 3 = 1
(4,6) 5 5 – 3 = 2
(6,0) 3 3 – 3 = 0
(6,2) 4 4 – 3 = 1
(6,4) 5 5 – 3 = 2
(6,6) 6 6 – 3 = 3
b. La media de los errores muestrales es e, es:
c. La desviación estándar de la distribución de los errores muestrales
e, es entonces:
La desviación estándar de la distribución muestral de un estadístico se conoce como error estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por x, es 1.58. Con esto se puede demostrar que si de una población se eligen muestras de tamaño n con reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la distribución de los errores muestrales.
En general se tiene:
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la formula siguiente para encontrar x .
Donde es la desviación estándar de la población de donde se toman las muestras, n es el tamaño de la muestra y N el de la población.
Distribución muestral de Proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar del estadístico media.
Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np 5 y n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de intentos.
Generación de la Distribución Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:
Artículos Buenos Artículos Malos Proporción de artículos defectuoso Número de maneras en las que se puede obtener la muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribución muestral de proporciones se tendría que hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total de muestras. Esto es:
Como podemos observar la media de la distribución muestral de proporciones es igual a la Proporción de la población.
p = P
También se puede calcular la desviación estándar de la distribución muestral de proporciones:
La varianza de la distribución binomial es 2= npq, por lo que la varianza de la distribución muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores en esta fórmula tenemos que:
, este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de corrección para una población finita y un muestreo sin reemplazo:
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de proporciones está basada en la aproximación de la distribución normal a la binomial . Esta fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la muestra.
A esta fórmula se le puede agregar el factor de corrección de si se cumple con las condiciones necesarias.
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solución:
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral de proporciones.
Aproximación de la distribución normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x 440) = ?
Media= np= (800)(0.60)= 480
p(x 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
Distribución
...