Ejercicios Resueltos de Estadística
coyote091 de Julio de 2015
27.136 Palabras (109 Páginas)827 Visitas
Ejercicios Resueltos de Estadística:
Tema 5: Inferencia: estimación y contrastes
1. Si X ~ N (40,10), calcular Pr (39≤ X ≤41) para n=10. ¿En qué intervalo se obtendrán el 95% de los resultados?
SOLUCIÓN:
Pr (39 0.31623)
Z = → N (0,1); Pr (39≤ X ≤41) = Pr (Z≤0.31623) - Pr (Z≤-0.31623) =
= 2 Pr (Z≤0.31623)
Y por tanto, Pr (39≤Z≤41) = 2∗0.6241−1 = .02482
Pr (µ-ε≤ X ≤ µ+ε)=0.95
Pr (µ-ε≤ X ≤ µ+ε)=2∗Pr(Z
Pr (Z =0.975 → Z 0.975 → ε=1.96 10 = 6.1981
Por tanto, el intervalo es: (33.802,46.198)
2. Si el contenido en gr. de un determinado medicamento X sigue una distribución N(7.5,0.3), calcular la probabilidad de que para una muestra de tamaño n=5, se obtenga
medio menor que 7, Pr ( X ≤ 7).
SOLUCIÓN:
A partir de una muestra de tamaño n=5 de una población normal N(µ=7.5,σ=0.3), tenemos que:
Pr(X ≤ 7) = Pr X 0−.37.5 ≤ 7 −0.73.5 = Pr(Z ≤ −3.7269)
5 5
Donde Z tiene una distribución normal estándar, y por tanto, Pr ( X ≤7) = 0.0001
3. Si la altura de un grupo de población sigue una distribución normal N(176,12), calcular la Pr(S≤10) para una muestra de tamaño 8.
SOLUCIÓN:
Considerando una muestra aleatoria de tamaño n de una población normal N(µ,σ), por el teorema de Fisher tenemos que:
(n σ−12)S 2 ~ χn2−1
En particular, para una muestra de tamaño n=8 de una población normal N(176,12), el estadístico sigue una distribución χ72 , y por tanto
Pr(S ≤10) = Pr(S 2 ≤100)= Pr 7 S 2 ≤ 700 = Pr(T ≤ 4.8611)
144 144
Donde la variable T sigue una distribución χ72 , es decir,
Pr(S ≤10) = 0.3232
4. Un ascensor limita el peso de sus cuatro ocupantes a 300Kg. Si el peso de un individuo sigue una distribución N( 71,7 ), calcular la probabilidad de que el peso de 4 individuos supere los 300Kg.
SOLUCIÓN:
Teniendo en cuenta que el peso de cada individuo tiene una distribución normal N(µ = 71,σ = 7), si seleccionamos una muestra aleatoria de 4 individuos, tenemos que:
i=1 > 300 ∑=4 Xi 300 = Pr(X > 75)= Pr X −7 71 > 757− 71 =
Pr∑4 X i = Pr i 14 > 4
4 4
= Pr(Z >1.1429) =1− Pr(Z ≤1.1429)
donde Z tiene una distribución normal estándar, y por tanto,
4
Pr∑ X > 300 =1− 0.8735 = 0.1265
i
5. Calcular la probabilidad de que la media µ se encuentre entre X ± 3S para poblaciones normales y n = 5.
SOLUCIÓN:
A partir del teorema de Fisher, en el muestreo sobre poblaciones normales, tenemos que los estadísticos X y S2 son independientes, siendo la distribución del estadístico
T = n ∗ X −µuna tn-1(t de Student de n -1 grados de libertad). En particular, si consideramos S
una muestra aleatoria de tamaño n = 5, la probabilidad de que la media esté entre X ± 3S viene dada por:
Pr(X −3S < µ< X + 3S)= Pr−3 < µ−S X < 3 = Pr−3 5 < < 3 5 = Pr(−3 5 < T < 3 5)
donde T tiene una distribución t4, y por tanto:
Pr(X −3S <µ< X + 3S)= Pr(−3 5 < T < 3 5)= 2Pr(T < 6.7082)−1= 2∗0.9987 −1= 0.9974
6. Calcular un intervalo de confianza al nivel α = 0.05 para la probabilidad de p de que un recién nacido sea niño si en una muestra de tamaño 123 se han obtenido 67 niños.
SOLUCIÓN:
Teniendo en cuenta que la proporción de varones recién nacidos puede modelizarse por una variable Bernoulli de parámetro p (probabilidad de que un recién nacido sea varón), el intervalo de confianza al nivel α = 0.05 viene dado por:
pˆ − z −pˆ(1− pˆ), pˆ + z −pˆ(1− pˆ)
1 n 1 n
Donde n = 123. pˆ = 12367 y z −= z0.975 =1.96, es decir,
1
(0.544715− 0.0880096,0.544715 + 0.0880096)
y por tanto, el intervalo (0.0456706,0.632725) contendrá a la proporción de varones nacidos con una probabilidad del 95%.
7. Calcular un intervalo de confianza al nivel α = 0.001 para el peso exacto mediante los resultados obtenidos con 10 básculas:
7.20, 7.01, 7.36, 6.91, 7.22, 7.03, 7.11, 7.12, 7.03, 7.05
SOLUCIÓN:
Suponiendo que las medidas del peso de las básculas sigue una distribución normal N(µ,σ2 ) con media el peso exacto, estamos interesados en encontrar un intervalo de confianza que contenga a la media de esta distribución, que a un nivel α = 0.001 y desviación típica desconocida, esta determinado por:
X −t
n−1;1−Sn , X + tn−1;1−α2 Sn
∑n Xi ∑n (Xi − X )2
donde n = 10, X = i=1n = 7.1040,S = n −1 = 0.1286 , y utilizando la tabla de la distribución t de Student t. Por tanto, el intervalo de confianza al
n
nivel 0.001 es: (6.9096,7.2984)
Y representa que la media del peso estará en dicho intervalo con una probabilidad de acierto del 99.9%.
8. Calcular un intervalo de confianza al nivel α = 0.05 para σ2 mediante las desviaciones que se producen en un proceso de fabricación cuya distribución es N(0,σ) a partir de la muestra
1.2, -2.2, -3.1, -0.2, 0.5, 0.6, -2.1, 2.2, 1.3
SOLUCIÓN:
Sabiendo que el proceso de fabricación sigue una distribución normal de media conocida µ= 0, un intervalo de confianza para la varianza σ2 al nivel α = 0.05 es el siguiente:
T− ,n χT2α n χ2
n;1 n; 2
∑n (Xi −µ)2
donde n = 9, T = i=1 = 3.05333 , y utilizando la tabla de la distribución χ2 , se n
tiene χ2, es decir, (1.44458,10.1763)
n;
Es el intervalo que contendrá con un 95% de acierto las desviaciones que se producen en el proceso de fabricación.
9. Calcular qué tamaño muestral debemos tomar para obtener µ con una precisión de
0.001 a partir de una muestra de una población N(µ,3).
SOLUCIÓN:
Teniendo en cuenta que el intervalo de confianza que contiene a la media µ de una población normal con varianza conocida es de la forma
X − z, X z
1− σn + 1−α2 σn
es decir, el error que cometemos al estimar µ mediante un intervalo de confianza al nivel α =
0.05, es
σ 3
error = z −=1.96
1n n
Por tanto, si en esta estimación deseamos obtener la media con una precisión de 0.001, tenemos que calcular n tal que el error que se cometa esté acotado por esta cantidad, error ≤ 0.001, es decir:
1. n → n = 5880 2 = 34574400
10. Para estudiar la efectividad de un medicamento contra la diabetes se mide la cantidad de glucemia en sangre antes y después de la administración de dicho medicamento, obteniéndose los resultados siguientes:
Antes 7.2 7.3 6.5 4.2 3.1 5.3 5.6
Después 5.2 5.4 5.3 4.7 4.1 5.4 4.9
Estimar la reducción producida por el medicamento.
SOLUCIÓN:
Suponiendo que las cantidades de glucemia siguen una distribución normal, las muestras obtenidas mediante las medicaciones anteriores y posteriores a la administración del medicamento son apareadas, es decir, sobre cada individuo de la población se obtiene una observación de la variable y posteriormente se repite la observación una vez que el individuo ha tomado el medicamento siendo esta última observación dependiente de la primera.
Para estudiar el efecto de dicho medicamento, resulta de gran interés la variable diferencia entre ambas mediciones, puesto que nos permitirá estimar la reducción o incremento de la glucemia provocada por este medicamento.
En este caso, la diferencia de ambas observaciones sigue una distribución normal de media la diferencia de ambas y desviación típica desconocida, N(µA −µD ,σ2 ), por lo que un intervalo de confianza al nivel α = 0.05, viene dado por:
(X − X )−t 1 1 S ,(X − X D )+ tn−1;1−α Sn
2
donde n=7, y
n
S = ∑ ((X Ai − XniD−)−1(X A − X D ))2 = 1.17473
y utilizando la tabla de la distribución t de Student, tn−1;1− = t6,0.975=2.4469 , es decir, la reducción de glucemia por el medicamento estará contenida a un nivel 0.05 en el intervalo (− 0.486448,1.68645), siendo la reducción estimada 0.6.
11. Se ha hecho un estudio sobre la proporción de enfermos de cáncer de pulmón detectados en hospital que fuman, obteniéndose que de 123 enfermos 41 de ellos eran fumadores. Obtener un intervalo de confianza para dicha proporción. Estudiar si dicha proporción puede considerarse igual
...