Diagrama De Caja
danixim16 de Junio de 2013
727 Palabras (3 Páginas)447 Visitas
DIAGRAMA DE CAJA (BOXPLOTS)
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
EJEMPLO DISTRIBUCIÓN DE EDADES
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
ORDENAR LOS DATOS
Para calcular los parámetros estadístico, lo primero es ordenar la distribución
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Q1= (24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; la mediana es la media aritmética de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta
Q2= (39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES
El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)
La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).
RI=Q3-Q1
Límite interior inferior = Límite del bigote inferior = Q1 - 1,5RI
Límite interior superior = Límite del bigote superior = Q3 + 1,5RI
Límite exterior inferior = Q1 - 3RI
Límite exterior superior = Q3 + 3RI
INFORMACIÓN DEL DIAGRAMA
Podemos tener abundante información de una distribución a partir de estas presentaciones.
• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%.
• El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados que el 25% de los mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años.
MUESTRA ORDENADA CON REEMPLAZO
Dada una población S = {a1, a2, •••, an} de n elementos, cuando extraemos r objetos de esta población, seleccionados uno a uno, tomando en cuenta el orden en que son elegidos, con la posibilidad de que un objeto sea elegido varias veces, ya que al hacer una elección, lo devolvemos o reemplazamos enseguida, antes de elegir el siguiente, diremos que tenemos una muestra ordenada con reemplazo de tamaño r.
En este tipo de muestreo, cada uno de los r elementos se puede elegir de n maneras diferentes, por lo tanto el número de r-uplas de este tipo que podemos obtener es:
n •n •n …r... •n = nr
puesto que este muestreo corresponde a un arreglo múltiple, de r grupos cada uno de n elementos.
MUESTRAS NO ORDENADAS CON REEMPLAZO
Sea S = {a1, a2,•••, an} una población de n elementos, llamamos muestra no ordenada, con reemplazo de tamaño r, a todo conjunto de r elementos, elegidos a partir de S, uno a uno, reemplazando cada objeto seleccionado inmediatamente después de su elección, sin importar el orden
...