ESTADISTICA BASICA
marianirri_1218 de Octubre de 2012
2.682 Palabras (11 Páginas)443 Visitas
UNIDAD 2. REPRESENTACIÓN NUMÉRICA Y GRÁFICA DE DATOS
PRESENTACIÓN DE LA UNIDAD
En la unidad anterior, conociste las dos grandes divisiones de la estadística: la que se dedica a la recolección, presentación y categorización de datos, llamada estadística descriptiva y la que se dedica a realizar hipótesis con base en dichos datos, la inferencial.
También aprendiste a determinar el espacio de estudio (es decir, la población) y las variables que se van a estudiar de acuerdo al problema planteado.
En esta unidad estudiarás la estadística descriptiva y aprenderás cómo organizar y presentar los datos obtenidos mediante el muestreo en poblaciones.
Cuando se realiza un trabajo que requiere a la estadística, se diseñan instrumentos para obtener los datos deseados. Existen muchos métodos para recolectar información, pero los más frecuentes son:
Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos, revisa en qué consisten.
Un experimento es una prueba que se realiza para determinar las características o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos te parecen más salados.
También, experimento se define como el proceso que se realiza para verificar una serie de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las características o comportamientos del fenómeno que se analiza.
Por ejemplo, un experimento para determinar la velocidad de la luz en el vacío.
La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cuál será más salado. En el segundo ejemplo, la hipótesis, a partir de estudios anteriores, es que la velocidad de la luz en el vacío es de 300 000 km/seg.
Por lo tanto, el experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error experimental.
Los datos que se recopilan, usando alguna técnica de las que acabamos de describir u otra, son organizados de acuerdo a los parámetros de la estadística descriptiva que estudiarás en esta unidad.
En esta unidad: Identificarás algunos conceptos que se utilizan en estadística descriptiva.
Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas
Utiliza las técnicas de representación numérica y gráfica para representar información a través de la organización de los datos obtenidos de una muestra o población
2.1. ORGANIZACIÓN DE DATOS Y DISTRIBUCIÓN DE FRECUENCIAS
INTRODUCCIÓN
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área sólo describe, resume, organiza y representa los datos obtenidos de una población o muestra de la población, sin elaborar inferencias ni obtener conclusiones.
La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación y distribución de estos datos.
A continuación, conocerás que existen diferentes tipos de presentación de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.
2.1.1. FRECUENCIAS
Antes de comenzar con el tema, es importante que consideres lo siguiente:
La frecuencia o frecuencia absoluta es el número de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendrías:
Dato Frecuencia
2 2 (porque se repite 2 veces)
3 3 (porque se repite 3 veces)
4 2 (porque se repite 2 veces)
5 4 (porque se repite 4 veces)
Total de datos (N) 11
La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el renglón i, se representa como Fi. También es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior:
Dato Frecuencia Frecuencia acumulada
2 2 2 (hasta aquí tienes 2 datos
3 3 5 (la suma de la frecuencia del primer dato con la del segundo dato 2+3)
5 2 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5)
7 4 11 (frecuencia de 2+frecuencia de 3+frecuencia de 5 frecuencia de 7)
Total de datos (N) 11
La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el número total de datos (N). La suma de esta columna da 1 (excepto cuando el resultado de las divisiones se redondea). Este dato también puede verse como un porcentaje, se representa como hi. Siguiendo con el ejemplo anterior:
Dato Frecuencia Frecuencia acumulada Frecuancia relativa
2 2 2 0.181 (se divide 2/11)
3 3 5 0.272 (se divide 3/11)
4 2 7 0.181 (se divide 2/11)
5 4 11 0.363 (se divide 4/11)
Total de datos (N) 11
La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el renglón i. Se representa como Hi, observa el ejemplo:
Dato Frecuencia Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada
2 2 2 0.1818 0.1818 (hasta este renglón sólo tienes esta frecuencia relativa)
3 3 5 0.2727 0.4545 (se suma la frecuencia relativa del primer dato con la del segundo dato 0.1818+0.2727)
5 2 7 0.1818 0.6363 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5)
7 4 11 0.3636 0.9999 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5+la frecuencia relativa de 7)
Total de datos (N) 11
Ejemplo de organización de frecuencias
En la siguiente pantalla observarás una tabla con la organización de frecuencias, los datos presentados son los siguientes:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.
FRECUENCIAS
No. renglón Datos obtenidos de la variable Frecuencia fi Frecuencia
acumulada Fi Otra forma para obtener Fi Frecuencia relativa hi Frecuencia relativa acumulada Hi
1 7 f1= 2 f1=F1= 2 f1 = F1=2 h1=f1/N=0.0625 h1=H1=0.0625
2 18 f2= 6 f1+f2= F2= 8 F1+f2=F2=8 h2=f2/N=0.1875 h1+h2=H2=
0.2500
3 23 f3= 8 f1+f2+f3= F3=16 F2+f3=F3=16 h3=f3/N=0.2500 h1+h2+h3=
H3=0.5000
4 41 f4= 4 f1+f2+f3+f4= F4=20 F3+f4=F4=20 h4=f4/N=0.1250 h1+h2+h3+h4
=H4=0.6250
5 47 f5= 7 f1+f2+f3+f4+f5= F5=27 F4+f5=F5=27 h5=f5/N=0.2187 h1+h2+h3+
h4+h5=H5=0.8430
6 52 f6= 5 f1+f2+f3+f4+f5+f6= F6=32 F5+f6=F6=32 h6=f6/N=0.1563 h1+h2+h3+
h4+h5+h6=
H6=1.0000
Total N=32 1.0000
2.1.2. INTERVALOS
Otro concepto muy utilizado en estadística descriptiva es el de intervalo. Conoce qué es y los demás conceptos asociados.
INTERVALOS Conjunto de valores agrupados entre dos números, conocidos como límites, en este caso, límites del intervalo.
INTERVALO DE CLASE Se llama intervalo de clase a la expresión que denota un intervalo.
AMPLITUD DEL INTERVALO La amplitud del intervalo es la distancia que hay entre los límites superior e inferior del intervalo. Se calcula restando el valor del límite inferior al valor del límite superior.
FRONTERA DE CLASE Son los puntos medios entre los límites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el límite inferior del siguiente.
MARCA DE CLASE También conocida como punto medio de clase, es el resultado de la suma de los límites inferior y superior del intervalo, dividido entre dos.
Ejemplo de intervalos
Observa cómo se representan los conceptos relacionados con los intervalos, coloca el cursor sobre las palabras resaltadas.
Dados los números 15 y 25, tendrías que:
El intervalo corresponde a todos los números que se encuentran entre 15 y 25.
El intervalo de clase sería: 15-25
Los límites del intervalo son:
Límite inferior=15
Límite superior=25
La amplitud del intervalo 15-25 sería: 25 menos 15, es decir, 10.
Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puede restar el dato menor al dato mayor y dividir el resultado entre el número de intervalos.
La frontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase serían: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por último, 25.5 y 36.5 para el tercer intervalo.
La marca de clase del intervalo 15-25 es igual a: 15+25=40/2=20.
Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque esto no es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la misma amplitud.
La formación de clases o intervalos de clase, que se representa con (k), depende, generalmente, del tamaño del rango de la población o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente.
Paso 1. Calcular el rango
Se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es el resultado de
...