Inferencia Estadistica
ugly11 de Noviembre de 2012
4.293 Palabras (18 Páginas)508 Visitas
2.1 CONCEPTOS BASICOS INFERENCIA ESTADISTICA
La Inferencia Estadística es la parte de la estadística matemática que se encarga del estudio de los métodos para la obtención del modelo de probabilidad (forma funcional y parámetros que determinan la función de distribución) que sigue una variable aleatoria de una determinada población, a través de una muestra (parte de la población) obtenida de la misma.
Los dos problemas fundamentales que estudia la inferencia estadística son el "Problema de la estimación" y el "Problema del contraste de hipótesis"
Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto de estudio y sólo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadística paramétrica ; por el contrario cuando no se conoce la forma funcional de la distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadística no paramétrica.
En lo que sigue nos vamos a limitar a problemas de inferencia estadística paramétrica, donde la variable aleatoria objeto de estudio sigue una distribución normal, y sólo tendremos que tratar de estimar los parámetros que la determinan, la media y la desviación típica.
Esta situación se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribución de probabilidad, por consideraciones teóricas, quedando únicamente indeterminados los parámetros que determinan la función de distribución.
Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la población
En todos estos problemas que estudia la inferencia estadística juega un papel fundamental la "Teoría de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teoría de Muestras" (procedimientos para tomar muestras de manera apropiada).
2.2 DISTRIBUCIONES DE MUESTREO
Conceptos básicos
Para introducir los conceptos básicos consideremos el siguiente ejemplo:
Supongamos que estamos interesados en determinar el número medio de televisores por
hogar en la ciudad de Caracas.
Para ello consideraremos primeramente:
Población: Conjunto de personas u objetos de interés en una Investigación.
Ej: Todos los hogares de la ciudad de Caracas
Muestra
Es una porción representativa de elementos de una población, elegida para su examen o
medición directa.
Note que generalmente es costoso el análisis de todos los datos, así que se hace necesario
realizar las mediciones de interés sólo en una porción representativa de la población e
inferir de ella resultados que corresponden a la población entera.
Ej: Medir la cantidad de televisores en un grupo de hogares de varias localidades,
municipios de la ciudad de Caracas, escogidos aleatoriamente de manera conveniente.
Parámetro
Es cualquier característica de una población, como la media de la población, la
desviación de la población, etc.
Ej: Número promedio de televisores por hogar en toda la ciudad de Caracas.
Estadístico
Es cualquier característica de una muestra, como la media de la muestra, la desviación de
la muestra, etc.
Ej: Número promedio de televisores calculado sólo a partir de los hogares que fueron
seleccionados en la muestra.
Muestreo
Proceso de selección de muestras, se utiliza cuando no es posible contar o medir todos los
elementos de la población objeto de estudio.
Tipos de Muestreo
Existen dos métodos para seleccionar muestras de poblaciones:
a) Muestreo no aleatorio o de juicio: Se emplea el conocimiento y la opinión personal
para identificar aquellos elementos de la población que deben incluirse en la muestra.b) Muestreo aleatorio o de probabilidad: En el cual todos los elementos de la población
tienen la oportunidad de ser escogidos para la muestra. Dentro de este tipo de muestreo se
encuentran:
b.1) Muestreo aleatorio simple: el cual es un método de selección de muestras que
permite que cada muestra posible pueda ser elegida con la misma probabilidad. Por su
parte cada elemento de la población tiene la misma oportunidad igual de ser incluido en
la muestra.
b.2) Muestreo sistemático: método en el cual los elementos que se muestrearán se
seleccionan de la población en un intervalo uniforme que se mide con respecto al tiempo,
al orden o al espacio.
b.3) Muestreo estratificado: método en el que la población se divide en grupos
homogéneos, o estratos, y después se toma una muestra aleatoria simple de cada estrato.
Aquí la variabilidad dentro de cada grupo es pequeña y entre los grupos es grande.
b.4) Muestreo de racimo: método en el que la población se divide en grupos o racimos de
elementos, y luego se selecciona una muestra aleatoria de estos racimos. La variabilidad
dentro de cada grupo es grande y entre los grupos es pequeña; es como si cada racimo
fuese un pequeña representación de la población en si mima.
El seleccionar uno u otro tipo de muestreo depende del problema en cuestión.
Analicemos nuestro ejemplo.
Imagine que decidiéramos seleccionar una muestra simple aleatoria para nuestro
propósito, ésto significaría que podría darse el caso que la mayoría de las familias
seleccionadas para formar parte de la muestra fueran de un sitio de clase alta donde
quizás las casas tienen múltiples habitaciones y cada una de ellas con un televisor, de
manera que podríamos concluir que el promedio de televisores por familia es mucho
mayor que el que realmente es en promedio por vivienda en una familia venezolana.
En este ejemplo, quizás fuese más conveniente construir algunos estratos, que
representen las diferentes zonas de Caracas, y de cada uno de ellos escoger de manera
aleatoria un grupo de familia para realizar el estudio.
Error Muestral
Es la diferencia entre el parámetro de la población y el estadístico de la muestra utilizado
para estimar el parámetro.
Distribución muestral
Es una lista de todos los valores posibles de un estadístico y la probabilidad asociada a
cada valor. Se considerarán la distribución muestral de medias y la de proporciones.
2.3 ESTIMACION PUNTUAL
Esencialmente son tres los parámetros de interés:
- En el caso de que investiguemos una variable cuantitativa:
a) Para la media de la población μ tomaremos como aproximación la media de la muestra
b) Para la varianza de la población σ2 tomaremos la cuasivarianza de la muestra.
- Si el estudio se centra en el estudio de un carácter cualitativo el parámetro de interés será la proporción de elementos de la población que pertenecen a cierta categoría C que lo aproximaremos con la correspondiente proporción en la muestra.
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el parámetro desconocido de la población. Al valor usado se le llama estimador.
• La media de la población se puede estimar puntualmente mediante la media de la muestra:
• La proporción de la población se puede estimar puntualmente mediante la proporción de la muestra:
• La desviación típica de la población se puede estimar puntualmente mediante la desviación típica de la muestra, aunque hay mejores estimadores:
2.4 ESTIMACION DE INTERVALO
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:
Intervalo de confianza El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de confianza.
Variabilidad del parámetro Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, por tanto, menor el error, y más sujetos deberán incluirse en la muestra estudiada. Llamaremos a esta precisión E, según la fórmula E = θ2 - θ1.
Nivel de confianza Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)•100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01, respectivamente.
Valor α También llamado nivel de significación. Es la probabilidad
...