Parametros
lorepebe29 de Septiembre de 2014
6.393 Palabras (26 Páginas)298 Visitas
ESTIMACIÓN DE PARÁMETROS
5.1. Introducción.
A la inferencia estadística le interesa sacar conclusiones de un gran número de acontecimientos (población), fundándose en las observaciones de una parte de los mismos (muestra).
La estadística nos proporciona herramientas que formalizan y uniforman los procedimientos para sacar conclusiones siempre que las muestras seleccionadas sean representativas de la población que han sido extraídas. Esta representatividad permite extender los valores que describen a las muestras (estadísticos), tales como la media, la desviación típica, un coeficiente de correlación, a la población correspondiente, es decir, la media o la desviación típica (estadísticos) pueden tomarse como estimadores de los parámetros μ y σ, valores que caracterizan a la población.
5.2. Parámetros.
La teoría de muestreo puede emplearse para obtener información acerca de muestras obtenidas aleatoriamente de una población conocida. Sin embargo, desde un punto de vista practico, suele ser mas importante y ser capaz de inferir información acerca de una población a partir de muestras de ellas. Dichos problemas son tratados por lainferencia estadística que utiliza principios de muestreo. Un problema importante de la inferencia estadística es la estimación de parámetros poblacionales o simplemente parámetros ( como la media y la varianza poblacionales ), a partir de los estadísticos muéstrales correspondientes o estadísticos ( como la media y la varianza muestral.
Conviene que los estadísticos, en su función de estimadores de los correspondientes parámetros, reúnan determinados requisitos. Fundamentalmente son:
• Carencia de Sesgo.
Un estimador (estadístico) carece de sesgo si el promedio (media) de todos los valores posibles de todas las muestras posibles de tamaño n de una población es igual al parámetro, es decir, si la media de la distribución muestral del estadístico considerado es igual al valor del parámetro. Así, la media es un estimador insesgado de μ porque se puede demostrar que la media aritmética de una distribución muestral coincide con el valor del parámetro.
• Consistencia.
Un estimador es consistente en la medida en que, al aumentar el tamaño de la muestra, - n - su valor se acerca cada vez más al parámetro correspondiente o lo que es lo mismo, si a medida que aumenta el tamaño de la muestra, las estimaciones que ésta proporciona son cada vez más próximas al valor del parámetro.
Algunos estimadores sesgados son consistentes, acercándose cada vez más sus valores a los de sus respectivos parámetros a medida que el tamaño de la muestra (n) aumenta, tal es el caso de s o s2 que son estimadores sesgados pero consistentes de la desviación típica (σ) o de la varianza (σ2) de la población.
• Eficiencia.
Se refiere a la precisión que alcanzan los estadísticos en la estimación de los parámetros, es decir, un estimador será tanto más eficiente cuanto menos varíe de muestra a muestra de una misma población. Como la variabilidad de una distribución muestral viene dada por su error típico, un buen estimador será aquel que menor error típico alcanza. Así, entre la media y la mediana, la primera es claramente más eficiente. La varianza de la distribución muestral de la mediana es mayor que la de la media, lo que significa que la mediana fluctúa más que la media en muestras sucesivas de la misma población.
En una población normal, la varianza de la distribución muestral de la media es de σ2/n y la varianza de la distribución muestral de la mediana es de 1.57xσ2/n. Si comparamos la eficiencia de la media respecto de la mediana dividiendo las varianzas de las distribuciones muestrales respectivas, se aprecia la superioridad de la media en grado de eficiencia.
5.2.1 Estimadores
Un estimador es una regla que expresa cómo calcular la estimación, basándose en la información de la muestra y se enuncia, en general, mediante una fórmula.
TIPOS DE ESTIMADORES
Los procedimientos de estimación pueden dividirse en dos tipos:
Estimación puntual: la estimación se representa mediante un solo número.
Estimación por intervalo: la estimación se representa mediante dos números que determinan un intervalo sobre la recta.
Ejemplo. Se quiere estimar la altura media de los alumnos de un determinado curso. Se puede dar la estimación diciendo que la altura media es de 1.65 m (estimación puntual) o bien decir que la altura media estará entre 1.6 m y 1.7 m (estimación por intervalo).
Un estimador puntual utiliza los datos de la muestra para obtener un número que estima el valor del parámetro. La estimación puntual de un parámetro no es muy significativa si no se acompaña de alguna medida del error probable que se comete al realizar la estimación. Por ello las estimaciones suelen ser de intervalo.
Un estimador por intervalo utiliza los datos de la muestra para obtener dos valores numéricos entre los cuales se supone que está el valor del parámetro estimado.
5.2.2 Intervalos de confianza: una media, dos medias, una varianza, dos varianzas.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es normal y es conocido.
• Intervalo de confianza para una media:
Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional , la varianza poblacional es desconocida, por lo que el intervalo para construido al final de II es muy poco práctico.
Si en el intervalo se reemplaza la desviación estándar poblacional por la desviación estándar muestral s, el intervalo de confianza toma la forma:
La cual es una buena aproximación para el intervalo de confianza de 95% para con desconocido. Esta aproximación es mejor en la medida que el tamaño muestral sea grande.
Cuando el tamaño muestral es pequeño, el intervalo de confianza requiere utilizar la distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la muestra), en vez de la distribución normal (por ejemplo, para un intervalo de 95% de confianza, los límites del intervalo ya no serán construidos usando el valor 1,96).
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida. Como es desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.
• Intervalo de confianza para la diferencia de medias .
Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras pequeñas se supone que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se basan en la distribución t.
Si s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaño n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100( ) por ciento para la diferencia entre medias es:
en donde:
es el estimador combinado de la desviación estándar común de la población con n1+n2 – 2 grados de libertad.
Ejemplos:
1. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que
...