ESTADÍSTICA DESCRIPTIVA . Medidas de tendencia central en datos no agrupados
Mayraa CMApuntes7 de Marzo de 2016
11.617 Palabras (47 Páginas)267 Visitas
1. ESTADÍSTICA DESCRIPTIVA
1.1 Introducción.
La palabra Statistik proviene de la palabra italiana statista que significa estadista. Los primeros que introdujeron el término de estadística a Inglaterra fue el Dr. E.A.W. Zimmerman. Su uso fue popularizado por Sir John Sinclair en su obra Statistical Account of Scotland 1791-1799 (Informe estadístico sobre Escocia 1791-1799).
Estadística la podemos definir como la ciencia que se encarga de recolectar, organizar, analizar e interpretar datos numéricos con el propósito de auxiliar en una toma de decisiones más efectiva.
La estadística se divide en dos ramas descriptiva e inferencial; la estadística descriptiva se encarga de recolectar, organizar, analizar, resumir y presentar datos de manera conveniente, útil y comprensible. La estadística inferencial realiza inferencias a partir de los estimadores de la muestra sobre los parámetros de la población.
La definición anterior nos presenta nuevos conceptos tales como: población, muestra, estimador y parámetro, para entenderla mejor definamos cada uno de éstos. Población es un conjunto de elementos con una característica común observable, muestra subconjunto de la población, donde cada uno de los elementos que la componen tuvo la misma probabilidad de salir elegido, parámetro es una característica numérica que identifica a una población dada y estimador o estadístico es un valor obtenido de la muestra que permite hacer predicciones sobre los parámetros de una población,
¿En dónde se aplica la estadística? Sería prolijo describir todas las actividades donde entra en juego la estadística como herramienta de investigación, creo que sería más fácil encontrar donde no es aplicable. En la medida que se logra un incremento en el conocimiento científico se van encontrando nuevas aplicaciones de le ciencia estadística. Sin embargo, y a manera de ilustración mencionaremos algunos de los usos de la estadística en alguno de sus campos.
- Establecimiento de normas de calidad de productos agrícolas e industriales.
- Encuestas de opinión.
- Estudios de mercado.
- Necesidades de los servicios de las ciudades.
- Contaminación ambiental.
- Inventarios agrícolas, ganaderos, forestales e industriales.
- Estimación de cosechas.
- Control estadístico de procesos.
- Prevalencia o incidencia de alguna plaga o enfermedad.
- Mejoras de calidad de los equipos.
- Disminución de costos de producción.
- Reducción de niveles de contaminación en procesos industriales, etc.
El tema contempla el estudio de: medidas de tendencia central, de dispersión y de posición tanto para datos agrupado como no agrupados; representaciones gráficas, y empleo del software Minitab y Excel en el análisis de estadística descriptiva.
1.2 Medidas de tendencia central en datos no agrupados.
Estas medidas son llamadas de tendencia central porque su valor por lo general se encuentra en el centro de los datos que se analizan, si éstos son ordenados de menor a mayor.
1.2.1 Media aritmética.
Si las observaciones de una muestra aleatoria de tamaño n son: x1, x2,...,xn, entonces la media de la muestra se simboliza por.
[pic 3]
Donde:
∑ = letra griega que simboliza suma.
xi = valor de la variable aleatoria.
n = número de observaciones.
Ejemplo. Sea una muestra de seis estudiantes donde la variable en estudio son los años de edad de cada uno de ellos.
[pic 4] | [pic 5] | [pic 6] | [pic 7] | [pic 8] | [pic 9] |
19 | 23 | 21 | 24 | 20 | 18 |
[pic 10]
Lo que significa que la edad promedio de los alumnos es de 20.8 años.
La media aritmética es un punto potencial que equilibra todos los puntos ubicados a uno y otro lado de ella; o sea representa el valor promedio de todas las observaciones de la muestra.
La media aritmética es muy sensible a las mediciones extremas, cuando estas medidas no están equilibradas en ambos lados de la misma, por ejemplo.
x1 | x2 | x3 | x4 | x5 |
9 | 11 | 20 | 19 | 150 |
[pic 11]
Como puede apreciarse el valor 41.8 cae fuera del grupo de observaciones, cuando esto suceda es recomendable verificar si el valor atípico que aparece en los datos es correcto (150), una observación atípica es un valor que es inusual en relación con el resto de los datos. Si el valor es correcto, la medida de tendencia central recomendada para analizar la información es la mediana.
La media aritmética se puede comparar con el punto de apoyo en el juego de sube baja, por ejemplo, sea una muestra de seis niños donde la variable aleatoria son los años de edad de cada uno de ellos. Puede observarse que seis es el valor que equilibra a los datos.
[pic 12] | [pic 13] | [pic 14] | [pic 15] | [pic 16] | [pic 17] |
4 | 2 | 6 | 2 | 7 | 15 |
[pic 18]
[pic 19][pic 20][pic 21][pic 22]
[pic 23] | [pic 24] |
[pic 25]
Así como hay la media de la muestra también existe la media poblacional y se denota por la letra griega μ (miu) y se define por:
[pic 26]
Donde:
∑ = letra griega que simboliza suma.
Xi = variable que se esta estudiando.
N = total de elementos que componen la población.
Puede observarse que para definir los parámetros de la población se utilizan letras mayúsculas o griegas, mientras que para definir los estimadores de la muestra se emplean letras minúsculas o números.
1.2.2 Mediana ( M ).
Es la medida de tendencia central que divide la muestra en dos mitades iguales, o sea, es el estadístico que se ubica exactamente a la mitad de los datos, el 50% de la información se encuentra a la izquierda y el otro 50% a la derecha.
Sea x1, x2,...,xn los elementos arreglados en orden creciente de una muestra, donde x1 indica el valor más pequeño y xn el valor más grande. Entonces la mediana queda definida por:
a. Si el número de observaciones es impar, la mediana es el valor de en medio.
...