Estimación De Parámetros
jonhabreu16 de Mayo de 2014
3.763 Palabras (16 Páginas)372 Visitas
Estimación de parámetros
Recordemos que una estadística basada en las mediciones contenidas en una muestra- es un estimador que nos aproxima al valor verdadero de un parámetro poblacional. Los estimadores tienen sus propias características. En estas notas se plantearán algunas cualidades "deseables" de los estimadores y, cuando se tienen varios estimadores del mismo parámetro, establecer algunas reglas para su comparación.
Estimación Puntual. Definiciones y Propiedades
Un ejemplo de un estimador puntual puede estar en el deporte de tiro al blanco, en el cual hacemos la siguiente analogía: Estimador Pistola y Estimación particular Bala. Sacar una una muestra de una población y estimar el valor del parámetro poblacional equivale a "disparar un solo tiro al blanco".
En general, se desea especificar una estimación puntual para un parámetro de la población que llamaremos Se indicará el estimador de por el símbolo En resumen: es el estimador de
Definición 1
Estimador Insesgado: Sea un estimador puntual de un parámetro . Entonces es un estimador insesgado de si de lo contrario se dice que es sesgado. En palabras, un estimador insesgado es aquel cuya media o valor esperado de la distribución de las de las estimaciones es igual al parámetro estimado.
Definición 2 "Sesgo":
El sesgo B (Bias) de un estimador puntual está dado por
Nótese, de acuerdo con las definiciones: en un estimador insesgado, el sesgo vale cero. Se pretende que, además del no-sesgo, que la dispersión de una distribución de estimaciones sea lo más pequeña posible. Es decir, se desea que la varianza del estimador, sea mínima.
ESTIMACIÓN POR INTERVALOS
Hemos visto que la media muestral es un buen estimador puntual de la media poblacional. El inconveniente principal es que un único valor observado de generalmente no es exactamente igual a µ; habrá cierta diferencia entre y µ . Sería conveniente tener idea de lo cerca que está nuestra estimación del verdadero valor de la media poblacional. También sería bueno poder dar información de lo seguros o confiados que estamos de la precisión de la estimación.
Para tener una idea, no solo del valor de la media, sino también de la precisión de la estimación, los investigadores optan por el método de estimación por intervalo o intervalos de confianza. Un intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos extremos L 1 y L 2 son estadísticos. Esto se utiliza para determinar un intervalo numérico a partir de la muestra. Se espera que este contenga el parámetro de la población que está siendo estimado. Si se amplía el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de µ del 95% es tal que: . Decir que un intervalo es un intervalo de confianza del 95% de µ significa que, cuando se utiliza un muestreo repetido de la población, el 95% de los intervalos resultantes deberá contener a µ; debido al azar, el 5% no incluirá la verdadera media poblacional. El grado de confianza deseado es controlado por el investigador.
Ejemplo
Hallemos un intervalo de confianza, del 95%, de µ, número medio de microgramos de partículas en suspensión por metro cúbico de aire, sobre la base de una muestra aleatoria de tamaño 5 dada en la que se ha calculado que una estimación puntual de µ es . Supongamos que por experiencias anteriores se sabe que , número de microgramos de partículas en suspensión por metro cúbico de aire, está normalmente distribuido, con varianza . Queremos extender la estimación puntual a un intervalo, de forma talque podamos tener una confianza del 95 % de que el intervalo obtenido contenga al verdadero valor de µ . Es decir, queremos determinar y de forma que Así:
Para hacerlo así, consideremos la partición de la curva normal tipificada dibujada en la siguiente figura:
Partición de Z para obtener un intervalo de confianza de µ del 95 %
Puede verse que
En este caso, , por tanto, podemos concluir que
Veamos que los límites superior e inferior del intervalo de confianza del 95% son:
Puesto que se supone que es 9, y y , son estadísticos. Sus valores observados por la muestra son
Puesto que este intervalo se obtuvo usando un procedimiento que, en muestreos repetidos, contendrá a la media en un 95% de confianza de que µ esté verdaderamente entre 58.37y 63.63:
58.37 = 61 - 2.63 61 61 +2.63 = 63.63
Intervalo de Confianza.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es normal y es conocido
CONTRASTES DE HIPÓTESIS
Cuando nos interesa decidir si una proposición, una conjetura o suposición acerca de un parámetro poblacional (hipótesis) es verdadera o falsa, el procedimiento de toma de decisión acerca de ésta se denomina contraste de hipótesis.
Los contrastes de hipótesis o de significación permiten verificar la veracidad de alguna hipótesis establecida acerca de una población, determinando si los valores difieren significativamente de los esperados por la hipótesis, o si las diferencias observadas se deben al azar.
Una hipótesis estadística es una suposición que se plantea respecto a un problema o a una población, con el fin de rechazarla o no.
En los contrastes de hipótesis se distinguen dos hipótesis estadísticas: la hipótesis nula designada por H0, conocida también como hipótesis de no diferencia, que es la que se establece en principio con el único propósito de rechazarla o "anularla"; y una segunda, la hipótesis de investigación o alterna, Ha, que es complementaria de la primera. Cuando se habla de contrastar una hipótesis nula contra una alterna, esto siempre se hace suponiendo que la nula es verdadera.
En general la forma de las hipótesis nula y alterna es:
H0: parámetro poblacional = ( , ) valor supuesto
Ha: parámetro poblacional ( > , < ) valor supuesto
TIPOS DE HIPÓTESIS Y REGIÓN CRÍTICA O DE RECHAZO
La hipótesis nula de no diferencia (=) contra una alterna de diferencia () es una hipótesis bilateral o de dos colas porque el rechazo de H0 puede ocurrir hacia un lado u otro; es decir, puede ser diferente porque es menor o porque es mayor que el valor supuesto o.
H0: = 0 vs. Ha: 0
Las hipótesis nulas del tipo () o () son hipótesis unilaterales o de una sola cola, la primera es unilateral superior o de cola derecha y la segunda es unilateral inferior o de cola izquierda. Esto es:
H0: 0 vs. Ha: > 0 es una hipótesis unilateral superior o de cola derecha, porque se rechaza H0 en el caso de que se obtengan valores muy por encima del valor supuesto.
Mientras que H0: 0 vs. Ha: < 0 es una hipótesis unilateral inferior o de cola izquierda, porque se rechaza H0 en el caso de que se obtengan valores muy por debajo del valor supuesto.
La región crítica o región de rechazo es la región que contiene los resultados menos favorables a H0, en el supuesto de que H0 sea verdadera y la región de no rechazo es la que contiene los valores más favorables a H0. Estas regiones están separadas por los valores críticos del estadístico de contraste que corresponden a un nivel de significación dado.
Según sea el tipo de hipótesis se tendrán regiones críticas para los dos lados (bilaterales o de dos colas) o para un solo lado (unilaterales o de una cola),
HIPÓTESIS NULAS
Las hipótesis nulas son, en un sentido, el reverso de las hipótesis de investigación. También constituyen proposiciones acerca de la relación entre variables solamente que sirven para refutar o negar lo que afirma la hipótesis de investigación. Por ejemplo, si la hipótesis de investigación propone: “Los adolescentes le atribuyen más impor¬tancia al atractivo físico en sus relaciones heterosexuales que las mujeres”, la nula postularía:
“Los jóvenes no le atribuyen más importancia al atractivo
...