ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Diagrama De Caja O Boxplot


Enviado por   •  5 de Noviembre de 2014  •  1.000 Palabras (4 Páginas)  •  473 Visitas

Página 1 de 4

Diagrama de Caja o Boxplot

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".

Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.

Es la representación gráfica, basada en cuartiles, que ayuda a exhibir un conjunto de datos. Para construir un diagrama de caja, solo se necesita cinco estadísticos: el valor mínimo, Q1 (cuartel 1), la mediana, Q3 (cuartel 3) y el valor máximo.

Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no está en el centro del rectángulo, la distribución no es simétrica. Son útiles para ver la presencia de valores atípicos.

En 1977 John Tukey (citado por Hildebrand, 1997) publicó un tipo de gráfico estadístico para resumir información utilizando 5 medidas estadísticas: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo. Este tipo de gráfico recibe el nombre de gráfico de caja (boxplot).

Un gráfico de este tipo consiste en un rectángulo (caja), donde los lados más largos muestran el recorrido intercuartílico (RIC). Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero ( recordemos que el segundo cuartil coincide con la mediana).

Este rectángulo se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Estos segmentos que quedan a izquierda y a derecha de la caja se llaman bigotes. ( Freund, Williams y Perles, 1992).

Tomemos un ejemplo: (Gráfico 1)

La variable medida en este caso es : tiempo en segundos para recorrer 100 m

Mediana

Primer cuartil Tercer cuartil

Valor mínimo de la variable Valor máximo de la variable

Los bigotes tienen un límite de prolongación, de modo que aquellos valores atípicos que se separan del cuerpo principal de datos se indican individualmente. A diferencia de otros métodos de presentación de datos, los gráficos de caja muestran los valores atípicos de la variable. Llamaremos valores atípicos de la variable a aquellos que están tan apartados del cuerpo principal de los datos que bien pueden representar los efectos de causas extrañas, como algún error de medición o registro. Su eliminación no se justifica, ya que el propósito del gráfico de caja consiste en brindarnos un mayor conocimiento de la forma en que se distribuyen los datos.

Tukey ( citado por Hildebrand, 1997) introduce un criterio para fijar los extremos de los bigotes. Para esto calcula 4 barreras, dos interiores y dos exteriores:

Barrera interior inferior=Primer cuartil – 1,5 . RIC

Barrera interior superior=Tercer cuartil + 1,5 . RIC

Barrera exterior inferior=Primer cuartil – 3 . RIC

Barrera exterior superior=Tercer cuartil + 3 . RIC

Recordemos que RIC (Recorrido Intercuartílico) es igual a la diferencia entre el Tercer cuartil y el Primero.

Si se consideran los valores de la variable comprendidos entre las dos barreras interiores, el valor mínimo de la variable y el valor máximo son los extremos de los bigotes.

Si existen valores de la variable comprendidos entre las barreras interiores y exteriores se consideran valores atípicos y se indican con *. Si existieren valores fuera de las barreras exteriores se consideran valores todavía más atípicos y se indican con • .

Por otra parte, este tipo de gráfico nos proporciona información con respecto a la simetría o asimetría de la distribución. Se utilizan los siguientes criterios: si la mediana está en el centro de la caja o cerca de él, constituye un indicio de simetría de los datos, si la mediana está considerablemente más cerca del primer cuartil indica que los datos son positivamente asimétricos y si está más cerca del tercer cuartil, señala que los datos son negativamente asimétricos. Asimismo, la longitud relativa de los bigotes se puede emplear como un indicio de su asimetría.

Una vez realizado el gráfico, ¿qué tipo de preguntas debemos formular para una mejor comprensión?

Algunas preguntas podrían ser las siguientes:

¿Qué porcentaje de los datos está representado por la caja?

¿Qué porcentaje representa cada uno de los bigotes?

¿Puede ser un bigote más largo que otro?. ¿Cuál es el significado?

¿Se encuentra la mediana siempre en el centro de la caja?

Ejemplo

Dominos Pizza ofrece entregas gratuitas de pizza a 15 km a la redonda. Raúl el propietario, desea información relacionada con el tiempo de entrega. ¿Cuánto tiempo tarda una entrega típica?. ¿En que margen de tiempos deben completarse la mayoría de las entregas?. En el caso de una muestra de 20 entregas, Raúl recopiló la siguiente información:

Valor mínimo = 13 min.

Cuartil 1 = 15 min.

Mediana = 18 min.

Cuartil 3 = 22 min.

Valor máximo = 30 min.

Elabore un diagrama de caja para los tiempos de entrega. ¿Qué conclusiones deduce sobre los tiempos de entrega?

El primer paso para elaborar un diagrama de caja consiste en crear una escala adecuada a lo largo del eje horizontal. Enseguida, dibujamos una caja que inicie en Q1 (15 min) y termine Q3 (22 min). Dentro de la caja trazamos una línea vertical para representar a la mediana (18 min). Por último, prolongamos líneas horizontales a partir de la caja dirigidas al valor mínimo (13 min) y al valor máximo (30 min). Estas líneas horizontales que salen de la caja, a veces reciben e nombre de bigotes, en virtud de que se asemejan a los bigotes de un gato.

El Diagrama de caja muestra que el valor medio de las entregas, 50%, consume entre 15 y 22 minutos. La distancia entre los extremos de la caja, 7 minutos, es el rango intercuartil. Este rango es la distancia entre el primer y tercer cuartel; muestra la propagación o dispersión de la mayoría de las entregas.

¿Cuál es la importancia entonces del uso de los gráficos de caja?

En particular, los gráficos de caja vinculan los conceptos de mediana, cuartiles, valor mínimo y máximo que los alumnos manejan individualmente pero no en forma global.

...

Descargar como  txt (6.2 Kb)  
Leer 3 páginas más »
txt