Métodos para el Cálculo de Cuartiles
DacioSíntesis21 de Febrero de 2016
758 Palabras (4 Páginas)692 Visitas
Nota Técnica: Métodos para el Cálculo de Cuartiles
Jesús Dacio Villarreal Samaniego
Enero, 2016
Existen varios métodos para el cálculo de los cuartiles o de los percentiles, que dependen de los supuestos que se hagan con respecto a la longitud del listado de datos. Es frecuente que, debido a dichas diferencias, el cálculo de estas medidas de ubicación no coincida entre diferentes paquetes de software, o que no haya concordancia entre los resultados obtenidos a través de un paquete estadístico y los que se hayan conseguido de forma manual. A continuación se explican dos métodos diferentes para el cálculo de los cuartiles.
Método 1 (LP = [n+1][P/100])
Consiste en medir el largo de la serie de datos de una unidad antes del primer valor hasta una unidad después del último valor. Bajo este enfoque una lista con n datos tiene un largo de n+1 valores y los cuartiles están localizados a distancias de (n+1)(1/4), (n+1)(1/2) y (n+1)(3/4). De forma equivalente en percentiles: (n+1)(25/100), (n+1)(50/100) y (n+1)(75/100).
Para aplicar este método se hace lo siguiente:
- Use la mediana para dividir el conjunto ordenado de datos en dos mitades.
- Excluya a la mediana de las dos mitades.
Éste método es el que se usa con mucha frecuencia para hacer cálculos manuales de los cuartiles y corresponde también a la función de Excel “=CUARTIL.EXC”. Algunos paquetes estadísticos como SPSS o Minitab utilizan por omisión este método de cálculo, y es también el procedimiento indicado por el Instituto Nacional de Estándares y Tecnología (NIST, por sus siglas en inglés) para el cálculo de cuartiles, deciles y percentiles.
Para ilustrar este método suponga que se seleccionaron al azar 10 personas y se les preguntó cuántas veces habían asistido a ver películas en alguna sala de cine durante el año pasado. Los resultados, ordenados de menor a mayor, fueron los siguientes: 2, 3, 5, 7, 11, 13, 17, 19, 23 y 29. Se desea conocer el valor del primer cuartil, de la mediana y del tercer cuartil de esta serie de datos.
Según el método en cuestión el largo de la lista sería 10 + 1 = 11 (el conteo empieza un valor antes del primero de la serie) y la recta numérica sería la siguiente:
[pic 1]
Así pues, el primer cuartil sería Q1 = (10 + 1)(1/4) = 2.75, es decir, el dato que está en la posición número 2.75. El segundo dato de la serie ordenada tiene un valor de 3 y el tercero tiene un valor de 5, así pues el primer cuartil correspondería a 3 + (0.75)(5 – 3) = 3 + (0.75)(2) = 3 + 1.5 = 4.5. Siguiendo un procedimiento similar la mediana (v. gr. el segundo cuartil) sería 12 y el tercer cuartil sería 20.
Método 2 (LP = [n–1][P/100])
El largo de la serie de datos se mide como la distancia entre el primer valor y el último valor de la lista. Es decir, una lista de n elementos tiene una distancia igual a n–1 y los cuartiles se localizan a distancias de (n-1)(1/4), (n-1)(1/2) y (n-1)(3/4). Sus equivalentes en percentiles serían: (n-1)(25/100), (n-1)(50/100) y (n-1)(75/100).
El procedimiento para este método es el siguiente:
- Use la mediana para dividir la serie de datos ordenados en dos mitades.
- Si la mediana corresponde a un dato (en oposición a ser la media de los dos datos intermedios, como es el caso de series con un número par de datos), incluya la mediana en ambas mitades.
Los valores encontrados a través de este método son conocidos como “Bisagras de Tuckey” y es el método que corresponde a la función de Excel “=CUARTIL.INC” (que es la función por omisión si ésta se escribe simplemente como “=CUARTIL” en Excel). También es el procedimiento que usan por omisión paquetes estadísticos tales como Megastat o StatPlus.
Considerando de nuevo la serie de diez datos del ejemplo anterior la recta numérica sería la siguiente bajo este método, puesto que se considera que tiene un largo de 9, es decir, 10 – 1:
...