Análisis Univariado Y Bivariado
natittan341 de Mayo de 2012
3.789 Palabras (16 Páginas)2.656 Visitas
Introducción
Este trabajo tratara acerca de un análisis estadístico descriptivo univariado y bivariado hecho a una muestra de pacientes extraídos de la clínica Viña del Mar. Para tal análisis se consideraran tres aspectos de cada paciente, en este caso se tomara: la edad, el número de hijos de cada paciente y finalmente la religión que practica.
El objetivo de este análisis será intentar demostrar las relaciones que se pueden establecer entre las variables escogidas, aplicando métodos estadísticos como por ejemplo, promedio, variabilidad, entre otros, para luego dar respuestas a tales relaciones.
Por otro lado, los resultados de este análisis y las relaciones que se establezcan entre las variables estudiadas nos podrán servir para posteriormente hacer ver la situación actual de nuestro país, su tasa de natalidad y como se estructura la familia del mismo, además de ver también una planificación de sus políticas.
Finalmente también podríamos apreciar el escenario que viven las principales religiones de nuestro país, es decir, que porcentaje de la población se guía por las religiones mayormente reconocidas y en última instancia ver el por qué de esta situación.
Metodología
La manera de hacer este análisis estadístico descriptivo univariado y bivariado, fue aplicando las diversas medidas que entregan tales métodos, pero a continuación se describirá como se realizó el análisis descriptivo univariado.
En primer lugar a la base de datos que se disponía, la población, que contenía diferentes parámetros como edad, peso, estatura, número de televisores, número de hijos, entre otros, se escogió tres variables. En este caso se eligieron dos variables cuantitativas y una variable cualitativa. Para las variables cuantitativas se eligió la edad (variable cuantitativa continua, que utiliza escala de razón) y el número de hijos (variable cuantitativa discreta, que utiliza escala de razón). Y para la variable cualitativa, en este caso nominal, se eligió la religión que practican cada uno de los pacientes.
En segundo lugar a esta base de datos de la clínica se le aplicó un muestreo aleatorio simple con el fin de seleccionar una muestra de treinta pacientes de la clínica presentada, dicho muestreo se realizo con el programa Microsoft Excel y la planilla que éste dispone, la selección que realizamos se registro en una tabla que contenía el numero del paciente, la edad y el número de hijos de éste (Para ver dicha tabla véase Anexo 2). Posterior al muestreo realizado, se ordenaron los datos de las variables escogidas (edad, número de hijos y religión) en tablas diferentes para cada una. Para la variable cuantitativa continua de edad, se construyó la tabla necesaria para dicha variable, es decir, se realizó una tabla con intervalos , el numero de éstos fue de cinco y la amplitud de cada uno fue de cuatro unidades, ya teniendo la tabla realizada clasificamos los datos según el intervalo en que se encontraban teniendo así la frecuencia absoluta (ni) de cada intervalo, también se le agregaron los limites reales a cada uno de los intervalos, así como también la marca de clase (mi) que representa a cada intervalo. A la tabla anterior se le añadió la frecuencia acumulada (Ni), frecuencia relativa (fi) y la frecuencia relativa acumulada (Fi), ya que nos servirán para los posteriores cálculos.
Luego se realizó la tabla de la variable del número de hijos, para ésta se vio cuales eran las cantidades de hijos que se repetían en nuestra muestra, que en este caso fueron 0, 1, 2, 3, 4. Posterior a esto vimos las frecuencias que tenia cada cantidad para obtener la frecuencia absoluta y así también obtener la acumulada y la relativa. Finalmente la última tabla correspondiente a la variable cualitativa de religión, se siguió un proceso similar a la anterior, en este caso se identificaron las religiones que se repetían (católica, evangélica, mormona y otras) y se identificó la frecuencia absoluta de cada una de ellas, así como se realizo la frecuencia acumulada y la relativa.
Teniendo las tablas descritas anteriormente realizadas, se prosiguió a realizar los diferentes gráficos correspondientes a cada una de las variables. Para la variable de número de hijos se realizo un grafico de barras, a la variable de edad se realizó el gráfico de polígono de frecuencia y finalmente a la variable de la religión se aplico un gráfico de barras. Posterior a esto se interpreto cada uno de los gráficos.
Luego de hacer los diferentes gráficos para las diferentes variables, se realizó el cálculo de los diferentes estadígrafos o medidas de resumen los cuales se pueden clasificar en medidas de tendencia central, medidas de variabilidad y medidas de posición que nos permitirán realizar nuestro análisis estadístico univariado, para este calculo se utilizo una calculadora científica. En primer lugar a la variable de número de hijos se le aplico las medidas de tendencia central que son el promedio o media, luego la media y finalmente la moda. Posteriormente se calculo de esta misma variable las medidas de posición, que para este caso se calcularon los cuartiles (cuartil 1, 2 y el 3) de ésta, cuando se obtuvo el valor de cada uno de los cuartiles se realizo el gráfico “diagrama de caja” o también llamado “Cajón con Bigotes”, tomando en cuenta también el mínimo y el máximo valor de la variable estudiada.
Finalmente se calculo las medidas de variabilidad, primero la varianza, luego la desviación estándar y por último el coeficiente de variación, para luego interpretar cada medida. Con la siguiente variable de edad se aplico los mismos estadígrafos en el mismo orden, y también realizando el “Diagrama de Caja”.. Para la última variable (religión) a diferencia de las otras dos, no se pudieron aplicar las medidas anteriormente mencionadas, a excepción de la medida de tendencia central llamada moda.
Por otro lado también se realizo un análisis estadístico bivariado, donde se tomaron las dos variables cuantitativas de la investigación, la edad y el número de hijos. Para realizar dicho análisis, en primer lugar se ordenaron estas dos variables en una tabla de contingencia, donde se combinaron ambas variables en la misma tabla, para poder establecer una relación entre ambas, es decir, ver si aumenta, disminuye o se mantiene constante el numero de hijos a medida que avanzan los años, además para ver con más claridad esta relación se realizo otra tabla de continencia con los mismos datos, pero con la frecuencia relativa porcentual (fi%). También para este análisis se calculó el coeficiente de correlación de Pearson, para ver el grado de asociación lineal de ambas variables. Por último se realizo un gráfico de dispersión con ambas variables, para demostrar mejor la relación que se presenta.
Para finalizar se extraerán diferentes conclusiones del análisis estadístico, ya sea univariado o bivariado y ver de que forma contribuyen a la finalidad expuesta al inicio de este trabajo.
Resultados y Análisis.
Como ya se mencionó nuestros datos son los siguientes:
- Población: 100 pacientes de la clínica Viña del Mar.
- Muestra : 30 pacientes escogidos por muestreo aleatorio simple.
- Variables a estudiar:
• Variable Cuantitativa Discreta (Escala de Razón): Numero de hijos por paciente.
• Variable Cuantitativa Continua (Escala de Razón): Edad de cada paciente.
• Variable Cualitativa Nominal: Religión que practica cada paciente.
Análisis Variable Cuantitativa Discreta: Número de hijos por paciente.
Tabla de la distribución de los pacientes según el número de hijos.
N° de Hijos (xi) ni Ni Fi Fi
0 7 7 0,23 0,23
1 3 10 0,1 0,33
2 7 17 0,23 0,56
3 9 26 0,3 0,86
4 4 30 0,13 1
Total 30
De acuerdo al grafico podemos decir que la distribución de los pacientes según el número de hijos que tienen es más bien homogénea, debido a que ninguna categoría
resalta mucho por sobre la otra, es una distribución simétrica, rescatando que la categoría con la frecuencia más alta es la de tres hijos.
Medidas de Tendencia Central
= 2 Me = 2 Mo = 3
De acuerdo a los resultados obtenidos es posible concluir que en promedio la muestra de los pacientes tiene alrededor de dos hijos por cada uno. Por otra parte es posible decir que la mitad de la muestra tiene a lo más dos hijos, no puede tener hijos o puede tener1 o 2. Por último la tendencia que más repite entre esta variable es la que cada paciente tiene tres hijos.
Medidas de Posición.
Cuartiles (Q)
Cuartil 1 (P25) (Q1) = 1
De acuerdo a esta medida, se puede decir que el 25% de los pacientes a lo más tiene 1 hijo, puede tener o no tener hijo.
Cuartil 2 (P50) (Q2) = 2
Esto significa que el 50% de los pacientes a lo más tiene 2 hijos, es decir, no tiene hijos
...