Inferencia Estadistica
jsanez13 de Abril de 2013
3.542 Palabras (15 Páginas)490 Visitas
INFERENCIA ESTADÍSTICA
El objetivo de la estadística es obtener conclusiones sobre una población con base en la información contenida en una muestra. Las poblaciones se caracterizan por medidas descriptivas numéricas llamadas parámetros. Los parámetros típicos de una población son la media, la desviación estándar, la proporción.
La inferencia estadística en una situación práctica contempla dos aspectos: la inferencia y una medida de su bondad.
TIPOS DE ESTIMADORES
Un estimador puntual del parámetro de una población es una regla que indica como calcular un número con base en los datos muestrales. Al número resultante se le llama estimación puntual del parámetro. Un estimador por intervalo es una regla que indica como calcular dos números con base en los datos muestrales.
Cuando se usa un estimador por intervalo para estimar el parámetro de una población, el par de números que se obtienen se llama estimación por intervalo o intervalo de confianza. El número mayor, que indica el extremo superior del intervalo se denomina límite superior de confianza (LSC). Similarmente el número extremo inferior del intervalo se denomina límite inferior de confianza (LIC).
El estimador del parámetro de una población es insesgado si la media de su distribución muestral es igual al parámetro. En otro caso se dice que el estimador es sesgado.
La distancia entre una estimación y el valor del parámetro se llama error de estimación.
La probabilidad de que un intervalo de confianza contenga al parámetro que se estima se denomina coeficiente de confianza.
Intervalo de confianza del (1-)100% para el parámetro basado en una muestra grande.
donde es el estimador del parámetro y es el margen de error o precisión de estimación y representa la máxima distancia que habrá entre el estimador y el parámetro.
Parámetros Estimadores
Desviación estándar del estimador
1.- Media poblacional () Media muestral ( )
; si n
2.- Diferencia entre medias poblacionales (1- 2 ) Diferencia entre medias muestrales ( )
3.-Proporción poblacional (P)
Proporción muestral ( ), donde
; si n
4.- Diferencia entre proporciones poblacionales(P1-P2) Diferencia entre proporciones muestrales( )
Ejemplo 1
Se desea estimar la producción diaria promedio de cierto producto en una planta de productos químicos. Se registra la producción diaria durante 50 días y se obtiene una media de 871 toneladas y una desviación estándar de 21 toneladas. Encuentre un intervalo de confianza del 90% para la producción diaria promedio.
Se sabe que , el coeficiente de confianza (1-) es 0.9; de aquí que = 0.1 y /2 = 0.05. De la tabla el valor correspondiente de Z/2 = 1.645.
Como se quiere estimar un promedio, entonces el parámetro de interés es , y el estimador es
Sustituyendo en la fórmula quedaría de la siguiente forma:
, restando y sumando se obtiene el LIC y el LSC, dando como resultado:
LIC = 866.11, LSC = 875.89. Entonces podemos decir que con una confianza del 90% la producción diaria promedio se encontrará entre 866.11 y 875.89 ton. De otra forma se puede decir que la producción diaria promedio es 871 mas o menos 4.89 ton.
Ejemplo 2
Una comparación del desgaste de dos tipos de llantas para automóvil se hizo rodando 100 llantas de cada tipo. El número de km-vida de cada llanta se anotó, en donde km-vida fue definido como el kilometraje andado antes de que el neumático quedase en un estado determinado de desgaste. Los resultados de la prueba fueron los siguientes:
Llanta 1 Llanta 2
Estime la diferencia en km-vida medios usando una confianza del 95%.
Como se quiere estimar un diferencia de promedios, entonces el parámetro de interés es 1- 2 , y el estimador es
Sustituyendo en la fórmula quedaría de la siguiente forma:
para un coeficiente de confianza (1-) del 95%, de aquí que = 0.05 y /2 = 0.025. De la tabla el valor correspondiente de Z/2 = 1.96.
1300(1.96)(184) 1300360.64
Restando y sumando se obtiene el LIC y el LSC, dando como resultado:
LIC = 939.36, LSC = 1660.64. Entonces podemos decir que con una confianza del 95% la diferencia entre los km-vida medios se encontrará entre 939.36 y 1660.64 km. De otra forma se puede decir que la diferencia de km-vida medios es 1300 mas o menos 360.64 km. Otra forma de interpretar este intervalo es que con una confianza del 95% la llanta 1 dura de 939.36km a 1660.64km mas que la llanta 2.
NOTA: Cuando el intervalo contiene al valor cero se dice que los dos promedios son iguales
Ejemplo 3
Una muestra de 100 electores en una comunidad produjo 59 electores a favor del candidato A. Estime la proporción de electores a favor del candidato A con una confianza del 99%.
Como se quiere estimar un proporción, entonces el parámetro de interés es P, y el estimador es
Sustituyendo en la fórmula quedaría de la siguiente forma:
0.59(2.575)(0.049) 0.590.126
restando y sumando se obtiene el LIC y el LSC, dando como resultado:
LIC = 0.464, LSC = 0.716. Entonces podemos decir que con una confianza del 99% la proporción de electores a favor del candidato A se encontrará entre 46.4% y 71.6% .
Ejemplo 4
Se considera cierto cambio en un proceso de fabricación de partes. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del nuevo procedimientos también los son, encuentre un intervalo de confianza del 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.
Como se quiere estimar un diferencia de proporciones de partes defectuosas, entonces el parámetro de interés es P1-P2 , y el estimador es
Sustituyendo en la fórmula quedaría de la siguiente forma:
para un coeficiente de confianza (1-) del 90%, de aquí que = 0.1 y /2 = 0.05. De la tabla el valor correspondiente de Z/2 = 1.645.
0.01(1.645)(0.0071) 0.010.0117
Restando y sumando se obtiene el LIC y el LSC, dando como resultado:
LIC = -0.0017, LSC = 0.0217. Entonces podemos decir que con una confianza del 90% la diferencia de proporciones de partes defectuosos entre los dos procesos se encontrará entre -0.17%% y 2.17% . Como el intervalo contiene el valor cero, se puede decir que la proporción de artículos defectuosos con los dos procesos es la misma.
Intervalo de confianza del (1-)100% para con base en una muestra pequeña(n<30)
= valor crítico de la distribución t de student que satisface /2 de probabilidad y n-1 grados de libertad.
Ejemplo
Se reúnen datos de una sustancia neutra ( pH =7.0) y son los siguientes: 7.07, 7.03 ,7.00, 7.01, 7.10, 7.01, 6.97, 6.98, 7.00 y 7.08. Encuentre el intervalo de confianza para el 95% de confianza.
De las observaciones anteriores se obtienen una media y una desviación estándar de 7.025 y 0.044 respectivamente . El valor de = = 2.2622, como se muestra en la tabla t siguiente:
gl. t.100 t.050 t.025 t.010 t.005
1 3.0777 6.3137 12.7062 31.8210 63.6559
2 1.8856 2.9200 4.3027 6.9645 9.9250
3 1.6377 2.3534 3.1824 4.5407 5.8408
4 1.5332 2.1318 2.7765 3.7469 4.6041
5 1.4759 2.0150 2.5706 3.3649 4.0321
6 1.4398 1.9432 2.4469 3.1427 3.7074
7 1.4149 1.8946 2.3646 2.9979 3.4995
8 1.3968 1.8595 2.3060 2.8965 3.3554
9 1.3830 1.8331 2.2622 2.8214 3.2498
10 1.3722 1.8125 2.2281 2.7638 3.1693
Sustituyendo en la fórmula se tiene lo siguiente:
de aquí LIC = 6.994 y LSC = 7.056
Finalmente se puede decir que el pH promedio de esta sustancia se encuentra entre estos límites con una confianza del 95%.
Intervalo de confianza del (1-)100% para 1 - 2 con base en muestras pequeñas (n<30)
donde:
Ejemplo:
Una operación de ensamblado en una planta requiere de un período de entrenamiento de aproximadamente un mes . Se ha sugerido un nuevo método de entrenamiento y se ha realizado una prueba para comparar el nuevo método con el procedimiento estándar. Se formaron dos grupos de empleados, uno siguiendo el método nuevo y el otro con el procedimiento estándar. El tiempo (en minutos) de armado se registró para cada empleado al final de tres semanas.
Procedimiento estándar(1) 32 37 35 28 41 44 35 31 34
Nuevo procedimiento(2) 35 31 29 25 34 40 27 32 31
Construya un intervalo de confianza para la diferencia de tiempos promedios del 95%.
De los datos se obtiene lo siguiente:
=35.22; =31.56; =24.45 ; =20.03
...