ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

MANUAL BASICO DE ESTADISTICA

Conduescolar19 de Abril de 2014

3.480 Palabras (14 Páginas)366 Visitas

Página 1 de 14

ORGANIZACIÓN DE DATOS , ORDENADOS, EN INTERVALOS DE CLASE.

Muestra al azar sobre la estatura en centímetros, de niños en una escuela:

107 111 111 112 112 113 113 113 114 114 115 115 116 116 116 117 117 117 117 118 118 118 118 119 119 119 119 120 120 120 120 121 121 121 121 121 122 122 122 122 123 123 123 123 124 124 124 124 125 125 125 126 126 126 127 127 128 128 129 129 130 130 133 135

Tabla 1

Estatura

(Y) Numero de muestras (f) Acumulado

(N)

107 1 1

111 2 3

112 2 5

113 3 8

114 2 10

115 2 12

116 3 15

117 4 19

118 4 23

119 4 27

120 4 31

121 5 36

122 4 40

123 4 44

124 4 48

125 3 51

126 3 54

127 2 56

128 2 58

129 2 60

130 2 62

133 1 63

135 1 64

1. Rango: Es la diferencia entre el valor mayor de los datos y el menor. Rango = 135 - 107 = 28

2. Intervalo de clase (K), se eligen de forma que las marcas de clase o puntos medios coincidan con datos realmente observados. Esto tiende a aminorar el llamado error de agrupamiento.

O fórmula de sturges: K = 1 + 3.3 x log N donde N = Número de datos N=64

K = 1 + 3.3 (log 64) = 6.96 (aproximamos a 7) K=7

3. Ancho de clase ( C ): Debe ser no menor de 5 y no mayor a 15 o 20, C=Rango/K.

El ancho de clase debe estar en un rango no menor de 5 y no mayor de 15 o 20.

C = 28/7 C= 4, (se ajusta a 5)

Límites extremos inferior y superior de los intervalos

Nuevo rango = (número de intervalos) x (ancho de clase)

Nuevo rango = 7 x 5 = 35

Ahora se tiene: rango nuevo - rango original : 35 - 28 = 7 (diferencia)

Cuando los datos son enteros, a la diferencia se le resta 1

Diferencia 7 -1 = 6 se resta 1, para justificar en el paso 3.

Este numero 6 se reparte entre el rango inferior (restando) y el superior (sumando), teniendo en cuenta si es par o impar, asi:

Rango inicial: superior = 135 inferior = 107

Diferencia -1 Rango inferior Rango superior

0 107 135

1 106 (resta 1) 135

2 106 (resta 1) 136 (suma 1)

3 105 (resta 2) 136 (suma 1)

4 105 (resta 2) 137 (suma 2)

5 104 (resta 3) 137 (suma 2)

6 104 (resta 3) 138 (suma 3)

y así sucesivamente.

4. Marca de clase. Es el punto medio del intervalo de clase y se obtiene sumando los limites inferior y superior de la clase y dividiendo por 2.

5. Limites reales de clase. Se obtienen sumando al limite superior de un intervalo de clase el limite inferior del intervalo de clase contiguo superior y dividiendo por 2.

Ejemplo. De acuerdo al ejemplo citado, encontremos cada uno de estos conceptos.

1. Rango: 135 – 107 = 28

2. Intervalo de clase: Si utilizamos (al azar) 5 intervalos de clase, el tamaño de cada uno será: 28/5 = 6 aproximadamente. Si utilizamos 15 intervalos de clase, el tamaño de cada uno será: 28/15 = 2 aproximadamente.

3. Ancho de clase: Considerando tomar como intervalo de clase 6. entonces el ancho sera: 28/6 = 5 aproximadamente

Tomando 6 intervalos de clase y ancho 5, los datos estarán distribuidos:

Intervalos Frecuencia

107 - 111 3

112 - 116 12

117 - 121 21

122 - 126 18

127 - 131 8

132 - 136 2

4. Marca de clase: (107+111)/2 = 109. Si consideramos, por ejemplo, tomar como marca de clase 108, 113, 118, ... los datos se pueden agrupar:

Intervalos Frecuencia

106 - 110 1

111 - 115 11

116 - 120 19

121 - 125 20

126 - 130 11

131 - 135 2

5. Límite reales de clase: (105+106)/2 = 105.5 , (110+111)/2 = 110.5, y asi sucesivamente. Los limetes reales de clase estaran dados como:

Intervalo Frecuencia

105.5 – 110.5

110.5 - 115.5

..

Estos rangos no seran lo mas representativos, dado a que no coinciden exactamente con los datos observados.

5. MEDIDAS DE TENDENCIA CENTRAL.

Las medidas de tendencia central son valores que generalmente tienden a ubicarse hacia el centro de una distribución. Las tres medidas más frecuentes de tendencia central son media, mediana y moda.

5.1 MEDIA o PROMEDIO.

Es un valor que tiende a situarse en el centro del conjunto de datos ordenados segun su magnitud. Es equivalente a dividir la suma de todos los puntajes, entre el número total de éstos, en la distribución.

Para el ejemplo: X =  (107+111+111+....) = 7724/64 = 120.69

Realizar estas operaciones, haciendo uso de papel y lápiz o de una calculadora normal, sería bastante dispendioso. Haga uso de la hoja electronica Excel, digite estos mismos datos en una columna cualquiera, por ejemplo a partir de la celda A1.

A

1 107

2 111

3 112

.. ...

64 135

65 =PROMEDIO(B2:B65)

En la celda A65 haga uso de la funcion PROMEDIO. Obtendrá el resultado esperado.

Para datos agrupados: (haga uso de la hoja electronica)

 o X =  mifi/ N en donde

mi = marca de clase de la i-esima clase

fi = frecuencia de la i-esima clase

Tabla 2

Intervalo

Yj-1 – Yj Marca de clase (m) Frecuencia (f) mf f. Acumula (N)

107 – 111 109 3 327 3

112 – 116 114 12 1,368 15

117 – 121 119 21 2,499 36

122 – 126 124 18 2,232 54

127 – 131 129 8 1,032 62

132 – 136 134 2 268 64

Suma 64 7,726

Media 120.72

Metodo abreviado.  o X = A +  difi/ N

Otra forma de obtener la media, cuando los intervalos de clase son iguales. Se toma una media supuesta (A) aquella marca de clase que tenga mayor numero de frecuencias (aunque se puede tomar cualquiera), luego se toman las diferencias de cada marca con respecto a esta (A).

Marca de clase (m) Diferencias d=X-A Frecuencia (f) df

109 -10 3 -30

114 -5 12 -60

A 119 0 21 -

124 5 18 90

129 10 8 80

134 15 2 30

Suma 64 110

Media 1.72

 o X =  mifi/ N = 119 + 1.72 = 120.72

5.2 MEDIANA.

Es el valor medio o la media artimética de los valores ordenados en orden de magnitud. Un 50% de los puntajes quedan encima de la mediana, y 50% por debajo. Si los puntajes suman un número par, la mediana es el promedio de los dos puntajes centrales, y por lo tanto ninguno puede atribuirsela. Si embargo si la suma de los puntajes es impar, la mediana sólo es el puntaje central.

Ejemplo:

3,4,4,5,6,8,8,8,10 la mediana es 6 ( Número de datos impares)

5,5,7,9,11,12,15,18 la mediana es igual a 1/2(9+11) = 10 (Número de datos pares)

Para nuestro ejemplo modelo: 107,111,111,112,........ 135 (hay 64 datos) (121 +121)/2 = 121

Para datos agrupados la fórmula viene dada por:

Mediana =

L1 = Límite real inferior de la clase mediana (clase que contiene la mediana)

N = Número de datos (frecuencia total)

( f)1 = Suma de las frecuencias de todas las clases por debajo de la clase mediana

f = Frecuencia de la clase mediana

C = Tamaño del intervalo de la clase mediana

Ejemplo:

Intervalo Frecuencia (f)

107 – 111 3

112 – 116 12

117 – 121 21

122 – 126 18

127 – 131 8

132 – 136 2

Suma 64

L1 = (116+117)/2 = 116.5

N = 64

( f)1 = (3 +12) = 15

f = 21

C = 5

Mediana = 116.5 + [(64/2 – 15)/21](5) = 120.5

5.3 MODA.

Es el valor que se presenta con la mayor frecuencia en una distribución.

2,2,5,9,9,9,10,10,12,18 la moda es 9 (equivalente al 30%)

3,5,8,10,12,15,16 no tiene moda

2,3,4,4,4,5,5,7,7,7 la moda es 4 y 7 (bimodal) (30% cada uno)

Para datos agrupados la fórmula viene dada por:

Lmo = Límite real inferior de la clase modal

d1 = Diferencia (sin considerar signo) entre la frecuencia de la clase modal y la frecuencia de la clase precedente

d2 =Diferencia (sin considerar signo) entre la frecuencia de la clase modal y la frecuencia de la clase siguiente.

W = Amplitud de la clase modal (intervalo de la clase)

Existen otras fórmulas para la variable continua, cuando la amplitud es constante.

Para nuestro ejemplo:

Lmo = 116.5 (21 es la frecuencia mayor)

d1 = [21 - 12] = 9

d2 = [21 – 18] = 3

W = 5

Moda = 116.5 + 9/(9+3)* 5 = 120.25

5.4 CUARTILES, DECILES, PERCENTILES.

Cuando la distribución contiene un numero alto de intervalos o de marcas de clase y se requiere obtener un promedio de una parte de ella, se puede dividir la distribución en cuatro, diez o en cien partes. En el primer caso se habla de Cuartiles, en el segundo Deciles y en el último Centiles o Percentiles.

Asi por ejemplo, si una serie de datos se colocan en orden de magnitud, el valor medio que divide al conjunto de datos en dos partes iguales es la mediana. Aquellos valores que dividen a los datos en cuat ro partes iguales representados por Q1, Q2 y Q3 se llaman primero, segundo y tercer cuartil. En igual forma, los valores que dividen los datos en diez partes iguales se llaman deciles (D1, D2, ....D9) y los que dividen en cien partes iguales se llaman percentiles (P1, P2,...P99)

El primer cuartil (Q1) se define como el valor de la variable que supera al 25% de las observaciones y es superado por el 75% de

...

Descargar como (para miembros actualizados) txt (23 Kb)
Leer 13 páginas más »
Disponible sólo en Clubensayos.com