Estadistica
Enviado por • 19 de Octubre de 2012 • 1.018 Palabras (5 Páginas) • 384 Visitas
ESTADISTICA DESCRIPTIVA
CARRERAS:CIENCIAS ADMINISTRATIVAS; SEGURIDAD Y DEFENZA
SOLUCIÓN PRIMERA GUIA Prof. Ing. German Huebla R
ACTIVIDAD DE APRENDIZAJE 1.1
PROBLEMA 1
a) Diagrama de barras (0,5 pts)
Y X
1 44
2 23
3 16
4 5
5 3
b) Diagrama de pastel (0,5 pts)
1 44
2 23
3 16
4 5
5 3
De los diagramas se puede observar que el mayor valor porcentual de internos, por nivel de seguridad de
prisión correponde al nivel 1 de mínimo a cntinuación el de bajo con una diferencia de ,aproximadamente
el 50%
PROBLEMA 2
a) Ordenar los datos en un arreglo descendente (0,5 pts)
9.00 11.00 12.00 12.75 13.8 16.4 18.5 21.45 25.8 29.9
b) Organizar los datos en una distribución de frecuencias con el número óptimo de clases, elegir 7 km.
como límite inferior de la primera clase (1 pts)
Nº de clases=> 2^k ≥ n 2^4 = 16 16>10 k= 4 CLASES
intervalo de clase: 29.9 - 9 5.225 A prox. 5.5 Lim. Inf Lim sup
4 1 7.00 13.00
2 13.00 19.00
3 19.00 25.00
4 25.00 31.00
c) Si se considera que 20 km es una distancia excesiva de recorrido para un vendedor, ¿qué porcentaje
de muestras se clasificarán como tales?
Existen tres valores sobre los 20 km y estos en relacion del total que son 10 datos, tendremos:
(3/10)* 100 = 30% Esto quiere decir que el 30 de la muestra se clasifican como tales
17-Nov-11 GPHR
ACTIVIDAD DE APRENDIZAJE 1.2
PROBLEMA 1 (1 pts)
a) Nota Frec X f Nota promedio :
69 1 69 514 85.66666667 Con este valor, entonces el
91 1 91 6 alumno aprueba la asignatura
72 1 72
94 3 282
Σ = 514
PROBLEMA 2
1 38.50 26 51.20 CALCULOS
2 41.90 27 51.40 Nº de clases=> 2^k ≥ n 2^6 = 64 64>50 k= 6
3 42.30 28 51.40 intervalo de clase: 63,7 - 38,5 4.2 i Aprox.= 4.5
4 43.60 29 51.90 6
5 45.70 30 52.00 a) DISTRIBUCIÓN DE FRECUENCIAS
6 45.90 31 52.00 CLASES
7 46.00 32 52.20 Lim. Inf Lim sup
8 46.00 33 52.30 1 38.50 43.00 Para realizar cualquier calculo respecto al: número de
9 46.90 34 53.00 2 43.00 47.50 numero de clases, intervalos de clase, número de valores
10 47.00 35 53.00 3 47.50 52.00 que se encuentran en cada clase, etc., es recomendable
11 47.00 36 53.00 4 52.00 56.50 ordenar los datos de menor a mayor
12 47.30 37 53.20 5 56.50 61.00
13 47.40 38 54.20 6 61.00 65.50
14 47.80 39 54.50
15 47.90 40 55.10 b) FRECUENCIA RELATIVA, FRECUENCIA ACUMULADA, FRECUENCIA RELATIVA
16 48.10 41 55.30 ACUMULADA %
17 48.80 42 56.80 CLASES FREC. Frecuenc. Relativa Frecuencia Acumul Frec. Relat. Acum
18 49.50 43 56.90 Lim. Inf Lim sup f fr FA frA
19 49.90 44 57.00 1 38.50 43.00 3 3/50 = 0.06 3 3 0.06 0.06
20 49.90 45 57.00 2 43.00 47.50 10 10/50 = 0.2 3+10 = 13 0,06+0,2= 0.26
21 49.90 46 57.10 3 47.50 52.00 18 18/50 = 0.36 13+18 = 31 0,26+0,36 = 0.62
22 50.00 47 57.10 4 52.00 56.50 10 10/50 = 0.2 31+10 = 41 0,62+0,2 = 0.82
23 50.10 48 58.00 5 56.50 61.00 7 7/50 = 0.14 41+7 = 48 0,82+0,14 0.96
24 50.90 49 63.10 6 61.00 65.50 2 2/50 = 0.04 48+2 = 50 0,96+0,04 1
25 51.00 50 63.70 50 1
NOTA: Para obtener cualquiera de las frecuencias es necesario, en primer
lugar, obtener la frecuencia absoluta (f)
c) HISTOGRAMA Y POLIGONO DE FRECUENCIAS Pts. Med
18 40.75 Para graficar el polígono de
16 45.25 frecuencias se une los puntos
14 49.75 medios de cada clase.
12 54.25
10 58.75
8 63.25
6
4
2
38.50 43.00 47.50 52.00 56.50 61.00 65.50
40.75 45.25 49.75 54.25 58.75 63.25
17-Nov-11 GPHR
d) Trazar ojiva "o menos". Leer qué porcentaje de piezas pesa 49,5 gr. o menos
100%
El porcentaje de piezas que
pesa menos de 45 gramos
es aproximadamente el 70%
0%
Trazar ojiva "o mas". Leer qué porcentaje de piezas pesa mas de 51,5 gramos.
El porcentaje de piezas que
pesa mas de 45 gramos es
,aproximadamente, el 40%
ACTIVIDAD DE APRENDIZAJE 1.3
PROBLEMA 1
X X Calcular la: media, mediana y moda de datos sin agrupar
1 79 16 128 MEDIA
2 86 17 129 ∑ X = 1425+2379 X = ∑ X 3804 126.8
3 86 18 134 n 30
4 87 19 145
5 89 20 145 MEDIANA: es el valor que se ubica exctamente en la mitad del conjunto de datos
6 89 21 147 ordenados (que no es lo mismo que agrupados)
7 91 22 149 Si el conjunto de datos es par (como en este caso es 30), en la mitad se
8 92 23 152 encuentran dos datos, se suman y se divide por 2. Si
9 95 24 154 por 2. Si el conjunto de datos es impar existe un solo valor
10 97 25 158 que se ubica exactamente en la mitad
11 98 26 159 Me = 127 + 128 127.5
12 98 27 162 2
13 99 28 184 MODA: Es o son los valores que mayor núnero de veces se repiten en
14 112 29 192 el conjunto de datos
15 127 30 241 Mo = 86, 89, 98, 145
1425 2379 Es multi o polimodal
17-Nov-11 GPHR
PROBLEMA 2 Con los datos del problema 1:
a) Organizar los datos en una disrtribución de frecuencias, use 65 como límite inferior de la primera clase
y 35 como ancho de intervalo.
CLASES FREC.
Lim. Inf Lim sup f X f+X FrA
65 100 13 82.5 1072.5 13
100 135 5 117.5 587.5 18
135 170 9 152.5 1372.5 27
170 205 2 187.5 375 29
205 240 0 222.5 0
240 275 1 257.5 257.5 30
30 3665
b) Calcular la: media, mediana y moda de datos agrupados
MEDIA: X = ∑ fX 3665 122.1666667
n 30
MEDIANA n 30 13
Me = Lm 2 w 100 2 35 114
fm 5
MODA: 1.) Aproximando al punto medio de la clase modal: Mo = (135+100)/2 = 117,5
2.) Valor mas preciso:
Mo = Lmo d1 100 (5-13) 35 123.3333333
d1+d2 (5-13) + (5-9)
c) Comparar la media y la mediana de datos agrupados con los de datos sin agrupar:
NO AGRUPADOS AGRUPADOS 1
X = 126.8 X = 122.7 Existe un 3,23% de diferencia, que estadísticamente, podemos 2
decir que son iguales 3
4
Me = 127.5 Me = 114 Existe un 10,6% de diferencia, que estadísticamente, no se 5
acepta como iguales. Esto es debido a que en datos sin agrupar 6
se toma en cuenta a todos los datos, mientras que en los datos 7
agrupados solo se toman en cuenta a los correspondientes a 8
esa clase. Es mas exacta 9
10
ACTIVIDAD DE APRENDIZAJE 1.4 11
PROBLEMA 1 12
Datos de declaraciones trimestrales de impuestos (miles usd) por ventas de 25 negocios en una pequeña 13
ciudad del Ecuador: 14
X X X Con estos datos sin agrupar. 15
1 5.40 11 10.20 21 12.40 16
2 7.20 12 10.30 22 12.80 a) Calcular el rango: 17
3 7.90 13 10.80 23 12.90 R = H - L = 14,5 - 5,4 = 9.10 18
4 9.10 14 11.10 24 13.10 19
5 9.10 15 11.10 25 14.50 b) Media 20
6 9.20 16 11.10 ∑x= 65.70 X = ∑ X 263.00 10.52 21
7 9.60 17 11.10 n 25 22
8 9.80 18 11.30 Mediana: 23
9 9.90 19 11.40 Me = 10.8 24
10 10.00 20 11.70 25
∑x= 87.20 ∑x= 110.10 17-Nov-11 GPHR
c) Primer cuartil: Tercer cuartil
L25 = (n+1) C L75 = (25+1) 75 19.50
100 100 Indica el lugar
L25 = (25+1) 25 6.50 Se ubica entre (11,4 y 11,7) =
100 Indica el lugar
Se ubica entre (9,20 y 9,60) = L75 = 11,4 + 0,5*(11,7 - 11,4)
L75 = 11.55
L25 = 9,20 + 0,5*(9,60-9,20)
L25 = 9.4
d) Diagrama de caja:
5 10 15
9.4 11.5
e) Comentario sobre la forma de distribución de los datos
Con referencia al grafico y resultados obtenidos, especialmente el diagra de caja, y las diferencias entre
el valor mínimo y valor máximo respecto a la media se puede concluir que los datos tiene forma
asimétrica.
f) Calcular la desviación estándar
X^2 X^2 X^2
1 29.16 11 104.04 21 153.76 ∑x ∑x
2 51.84 12 106.09 22 163.84 S = n
3 62.41 13 116.64 23 166.41 n - 1
4 82.81 14 123.21 24 171.61
5 82.81 15 123.21 25 210.25 2859.90 2766.76
6 84.64 16 123.21 ∑x= 865.87 S = 24
7 92.16 17 123.21
8 96.04 18 127.69 S = 1.969983079
9 98.01 19 129.96
10 100.00 20 136.89
∑x= 779.88 ∑x= 1214.15
PROBLEMA 2
Con los datos del problema 2 de la Act. Aprend. 2
a) Calcular la desviación estándar
CLASES FREC.
Lim. Inf Lim sup f X fX fX ∑fx ∑fx
38.50 43.00 3 40.75 122.25 4981.6875 S = n
43.00 47.50 10 45.25 452.5 20475.625 n - 1
47.50 52.00 18 49.75 895.5 44551.125
52.00 56.50 10 54.25 542.5 29430.625 131601.13 130101.01
56.50 61.00 7 58.75 411.25 24160.9375 S = 49
61.00 65.50 2 63.25 126.5 8001.125
50 2550.5 131601.125 S = 5.533054661
b) Calcular el coeficiente de variación
CV = S 5.53 10.84699992
X 51.01
17-Nov-11 GPHR
PROBLEMA 3
a) Elaborar el diagrama: tallo-hoja
1 50 50 80 80
2
3
a) Alrededor de qué valor, si lo hay, se encuenyran concentrados los valores de lo cheques rechazados? 150
Refiriendonos al diagrama tallo-hoja se observa claramente que los cheques rechazados se encuentran 150
concentrados en el valor de 200 y 290. 180
180
PROBLEMA 4 200
Un conjunto de 65 observaciones tiene una media de 37,4 y una varianza de 4,96 200
a) Si la distribución de los datos no es simétrica, entre qué valores caerá, al menos el 75% de las 200
observaciones? 200
n = 65 200
X = 37.4 Chebychev Intervalo de confianza: IC 210
σ = 4.96 1 - 1 0.75 ( Determina entre qué valores se encuentra lo que se pide) 220
S = 2.23 k^2 IC = X ± k*S 220
32.94 (valor menor) 250
k = 1 2 IC = 37,4 ± 2 * 2,23 250
1 0.75 41.86 (valor mayor) 250
250
a) Si la distribución fuese simétrica, ¿cuántas observaciones se encontrarán en el intervalo 32,44 y 42,36 ? 250
260
Forma de la curva cuando la Z1 = X1 + X 32,44 - 37,44 -2.227105745 280
distribución es simetrica S 2.23 290
En el apendice respectivo buscamos 300
37.4 a qué valor de área corresponde el 300
Valor de la media (X) valor de -2,23 y corresponde a: 300
32.44 42.36 Area1 = 0.4871
Intervalo Inferior Intervalo Superior
Z2 = X2 + X 42,36 - 37,44 2.206278027
Para obtener el número de observaciones S 2.23
que se encuentran entre los intervalos pedidos Area 2 = 0.4864
Sumamos: Area1 + Area2= 0,4871 + 0,4864 = 0.9735
Este porcentaje (de 97,35%) corresponde a 63,05 observa
ciones que se encontrarán en el intervalo de 32,44 y 42,36
...