MEDIDAS DE DISPERSION
alena17 de Diciembre de 2011
4.185 Palabras (17 Páginas)7.294 Visitas
INDICE
Pags.
Portada
Índice 2
Introducción 3,4
1 Medidas de Dispersión 5
2 Conceptos 11
3 Ejercicio 21
Bibliografía 22
Introducción
El concepto de Estadística es muy amplio, y sus aplicaciones directas o indirectas, muy numerosas; resulta difícil, por ello, dar una definición. Sin embargo, la idea más adecuada es considerar que incumbe a la Estadística la recogida, ordenación, resumen y análisis de datos de cualquier tipo sobre colectivos, lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadística: es necesario, pues, considerar un grupo de elementos (personas, animales, cosas, experimentos, etc.) a los que se refieren los datos que se consideran. Este conjunto puede venir dado de dos formas que condicionan toda clasificación interna de la Estadística, y que son las siguientes: Población, o conjunto de todos los elementos cuyo estudio nos interesa. Si se dispone de datos de una o más variables sobre la población completa, o se puede acceder a ellos, la Estadística tendrá como misión que la recogida sea adecuada, se ordenen, se estructuren y se resuman dichos datos para su mejor comprensión, es decir, que se describan. Ello nos llevará a hablar de Estadística Descriptiva. Por ejemplo, el conjunto de los varones mayores de 65 años y residentes en una provincia sería una población. Muestra, o conjunto de elementos de los que efectivamente se dispone de datos, y que es una parte (a menudo pequeña) de la población. Cuando no se puede acceder a los datos de toda la población, que es lo más frecuente, y se debe trabajar con sólo los de la muestra, a la simple descripción de los datos se añade el interés por valorar hasta qué punto los resultados de la muestra son extrapolables o generalizables a la población; en consecuencia, será necesario utilizar no sólo las técnicas de la Estadística Descriptiva, siempre obligadas en todo caso para la comprensión de los resultados, sino también otras que permiten inferir afirmaciones sobre la población a partir de los datos de la muestra y que constituyen la Estadística Inferencial o Inferencia Estadística.
Podría parecer que las medidas de tendencia central son suficientes para resumir y describir los conjuntos de los cuales proceden, sin embargo, múltiples circunstancias exigen la descripción de otros rasgos de los datos existentes.
El complejo de conceptos matemáticos plantea dificultades de comprensión de unos a falta de dar sentido a otros; tal es el caso de las frecuencias implicadas en la media aritmética y ésta, a su vez, en algunas medidas de dispersión (desviación media, desviación estándar, entre otras).
El propósito de un estudio estadístico suele ser, extraer conclusiones acerca de la naturaleza de una población. Al ser la población grande y no poder ser estudiada en su integridad en la mayoría de los casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de ésta, lo que nos lleva, en primer lugar a la justificación, necesidad y definición de las diferentes técnicas de muestreo.
La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla.
1. MEDIDAS DE DISPERSIÓN
Cuando se tiene una serie de mediciones de observaciones realizadas en una investigación no basta con presentar la media o la mediana según sea el caso. Desde luego que la información no es despreciable, pero se requiere lograr información más objetiva, por ejemplo saber cómo es la variación de dichas observaciones, es decir, como se dispersan, o se sitúan en el área bajo la curva.
Varias son las medidas estadísticas, que se utilizan para dar una idea clara de cómo es la dispersión o variación de las observaciones. Entre otras, el rango, extensión o amplitud, la desviación estándar, el coeficiente de variación, percentiles y el rango o amplitud intercuartil .
La diferencia entre la observación más grande y la más pequeña es lo que se denomina rango, En el campo de la estadística el rango señala la amplitud de la variación de un fenómeno entre su límite menor y uno claramente mayor. El rango estadístico, por lo tanto, es el intervalo que contiene dichos datos y que puede calcularse a partir de restar el valor mínimo al valor máximo considerado. Lo primero que se tiene que hacer es organizar los datos, por ejemplo en una grafica de tronco y hoja o bien una lista en orden ascendente o descendente. Se hace la operación aritmética y se obtiene un número que es el rango, esta información o número obtenido es poco útil, por lo cual muchos autores al mencionar y exponer el rango, anotan los valores mínimo y máximo de la lista de observaciones, lo cual tiene mayor utilidad, porque nos indica de alguna forma como están dispersos los datos o más bien cual es la amplitud de la dispersión de las observaciones. Por ejemplo:
23,34,33,32,35,36,28,27,30 ( primero ponerlos en orden)
23,27,28,30,32,33,34,35,36
En el primer caso, el rango sería = ( 36 – 23 = 13)
En el segundo caso se pondría: rango = 23 a 36, esta información tendría mayor utilidad para describir la amplitud de los datos
Cuando se tienen intervalos en una tabla de frecuencias, se hace un cálculo aproximado usando el limite inferior del intervalo de clase menor y el limite superior del intervalo de clase mas alto. En el ejemplo de abajo sería 3.0 a 7.9
Intervalos
3.0 – 3.9
4.0 – 4.9
5.0 – 5.9
6.0 – 6.9
7.0 – 7.9
Una medida de dispersión, muy útil y por lo tanto comúnmente utilizada es la desviación estándar ya que estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
Desviación estándar: Se calcula como raíz cuadrada de la varianza.
En estadística la media es una medida representativa y su uso es común en la vida cotidiana. Ordinariamente, utilizarla implica realizar un cálculo cuyo resultado no se sabe interpretar. Ese conocimiento se basa principalmente en la ejecución de un algoritmo, resumido en una expresión matemática conocida comúnmente como “fórmula”. Pero eso no es comprender la medida en sí, lo cual plantea una limitación en la comprensión de otras medidas representativas que la incluyen. La comprensión del concepto de medidas de dispersión supone también el conocimiento funcional y el conocimiento analógico de la media y de la desviación estándar como un ejemplo de medidas de tendencia central y de dispersión.
Por conocimiento funcional entendemos la comprensión de la media como un concepto significativo del mundo real en el plano de su uso en lo cotidiano, no sólo en cuanto al cálculo numérico, sino también en cuanto a los modos de expresión e interpretación accesibles a la vida diaria. Pollatsek, Lima y Well (1981) plantean que entre los estudiantes se tienen diferentes grados de conocimiento funcional sobre la media y que los contextos más concretos facilitan la comprensión de la misma. De tal modo que, la comprensión tenga un cambio, de situaciones concretas a modelos matemáticos abstractos.
El conocimiento de cálculo tendría que incluir el algoritmo de cálculo con información acerca de cómo obtener el resultado numérico apropiado. A su vez, la comprensión de las medidas de dispersión no implica sólo el concepto de media, sino también toda una serie de procesos de tipo algebraico y aritmético, como son el uso de porcentajes, conjuntos, mayor que, menor que, suma, multiplicación y sus inversos, exponentes, valor absoluto, entre otros; es decir, operar con números reales y naturales.
Se considera que el conocimiento analógico se traduce en imágenes (gráficas, tablas,…) del concepto, en este sentido la media como un punto de balance, en la que la distribución de los pesos se identifica con la distribución de frecuencias de datos elementales. En el caso de tablas no sólo son una herramienta donde organizar un conjunto de datos sino son la expresión del proceso cognitivo implicado en la comprensión de alguna medida.
Por ello, considerar que estudiantes y en ocasiones profesores resuelven problemas como si fuera sólo ejecutar un procedimiento puramente formal, únicamente en términos de cálculo basado en datos abstractos, puede conducir a un desempeño correcto en la aplicación mecánica del algoritmo. Ello tiene
...