ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Realice un histograma y describa la información según la forma y la curtosis de los datos

Pedro Zarate OrtizApuntes1 de Julio de 2018

2.048 Palabras (9 Páginas)1.146 Visitas

Página 1 de 9

Parte 1

Tamaño de muestra

Utilizando la variable edad (P6040), realice lo siguiente:

  • Realice un histograma y describa la información según la forma y la curtosis de los datos.

[pic 1]

Ahora veamos la medida de forma la curtosis (o apuntamiento)  la cual mide  cuan escarpada o achatada esta una curva  o distribución.

El coeficiente de curtosis  viene dado por la siguiente ecuación:

Curtosis=[pic 2]

Siendo

=la media [pic 3]

S=desviación típica

La curva se puede clasificar en 3 grupos según el signo de la curtosis, es decir según el signo de la distribución.

  • Leptocurtica: la curtosis>o. los datos están muy concentrados en la media siendo una curva muy apuntada
  • Mesocurtica: : la curtosis=0 la distribución es normal
  • platicurtica: la curtosis

Del resumen de los datos se tienen  que

Media = 30,525   Desviación Estándar = 19,6759

Luego   Curtosis= =  -  0.749137[pic 4]

Luego respecto a la  información  de los datos (edad “p6040”) Según la forma la curtosis  es platicurtica  muy poca concentración de datos  en la media presentando una forma muy hachada. Es decir  el valor de curtosis  no se encuentra dentro del rango esperado para datos provenientes de una distribución normal.

  • Realice una descripción numérica y descripción como es la población.

La población consta de 31 variables las cuales están clasificadas como numéricas y categóricas dichas variables están clasificados como directorios, secuencias orden, hogar, Registro p6016, p6020 edad p6040, clase, mes Dpto.  Entre otras, algunas variables tienen un tamaño de 320 datos

  • Calcule una nueva variable que sea el [pic 5]

A partir de la variable    vamos a generar una nueva variable la cual seria [pic 6][pic 7]

[pic 8]

  • Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente fórmula:

[pic 9]

Donde, se tiene lo siguiente:

 Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.

S: Es la desviación estándar de la variable.

[pic 10]Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto que no supere 0.5.

Del resumen de los datos anteriores se tiene:

µ=9.2162

S=4.4333

[pic 11]=0.5

N=320

Con un nivel de confianza del 95% es decir α=0.05 entonces el cuantil de la distribución normal estándar seria == 1.96[pic 12][pic 13]

Así reemplazando en la ecuación anterior se tiene:

=  ==302.01302 es decir[pic 14][pic 15][pic 16][pic 17]

[pic 18]

  • Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra, utilizando el algoritmo del coordinado negativo.

Veamos la implementación del algoritmo del coordinado negativo. Para realizar una selección de elemento para una muestra.

Así  para extraer la muestra de tamaño n de un universo de N objetos.

Generar N realizaciones de una variable aleatoria (k U) con distribución  uniforme (0,1).[pic 19][pic 20]

Asignar al elemento k-´esimo de la población.[pic 21]

[pic 22]    [pic 23]     

Ordenar la lista de elementos descendente (o ascendentemente) con respecto  a este número aleatorio .[pic 24]

[pic 25]   [pic 26]

A continuación, seleccionar los n primeros (o los n últimos) elementos. Esta selección corresponde a la muestra realizada.

En este caso note que

[pic 27]

[pic 28]   [pic 29]

Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente:

  • Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias?

[pic 30]


(Grafico # 1)

Del gráfico de frecuencia anterior se tiene existen mucha diferencia en cuanto a la comparación entre las variables escolaridad (ESC) y sexo (P6020) hombres y mujeres, es decir el nivel de escolaridad en mujeres se encuentra entre 0 a 19 mientras que en los hombres de 0 a 20, también se puede ver que 30 mujeres se encuentran en un nivel de escolaridad 10,  y  17 mujeres tienen nivel de escolaridad 0 del total que son 157. Por otro lado, se puede ver que hay 27 hombres con un nivel de escolaridad 5 y 24 hombres con nivel de escolaridad 1, del total que son 207 mujeres.

  • Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de resultados.

Veamos un estudio descriptivo de las variables anteriores escolaridad (ESC) y sexo (P6020)

En cuanto a la escolaridad (ESC) para el sexo masculino estas variables constan de 157 hombres la consta un nivel de escolaridad de (0 a 20) puede observarse que en esa columna hay unas casillas en NA

Veamos la lectura de datos:

[pic 31]

[pic 32]

En cuanto a la escolaridad (ESC) para el sexo femenino estas variables constan de 207 mujeres con niveles de escolaridad de (0 a 19) puede observarse que en esa columna hay unas casillas en NA

Veamos la lectura de datos:

[pic 33]

[pic 34]

  • Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la escolaridad de los hombres y de las mujeres de forma individual.

Calculemos un intervalo de confianza del 95% para la escolaridad de los hombres y de las mujeres de forma individual

  • Hombres

Intervalo de confianza para la media.  Varianza Desconocida

Un intervalo de confianza del (1 - α) 100% para  µ está dado por

 - ≤  µ  ≤ + [pic 35][pic 36][pic 37][pic 38]

Donde  es el punto de la distribución t, con (n -1) grados de libertad, que deja a su derecha un área de α/2.[pic 39]

Del resumen de los datos se tienen:

n =148

= 7.42568[pic 40]

S= 4.80234

Para α=0.05 entonces  1.976233[pic 41]

Reemplazando  en la ecuación anterior se tiene:

7.42568- ≤  µ  ≤[pic 42][pic 43]

6.64556≤  µ  ≤ 8.2058[pic 44]

Por lo que el intervalo pedido para la escolaridad de los hombres es [6.64556, 8.2058], es decir la media verdadera se encuentra en algún lugar entre 6.64556 y 8.2058

  • mujeres

Intervalo de confianza para la media.  Varianza Desconocida

Un intervalo de confianza del (1 - α) 100% para µ está dado por

 - ≤  µ  ≤ + [pic 45][pic 46][pic 47][pic 48]

Donde  es el punto de la distribución t, con (n -1) grados de libertad, que deja a su derecha un área de α/2.[pic 49]

Del resumen de los datos se tienen:

n =158

= 7.72785[pic 50]

S= 5.07855

Para α=0.05 entonces   1.975189[pic 51]

Reemplazando  en la ecuación anterior se tiene:

7.72785- 1.975189≤  µ  ≤[pic 52][pic 53][pic 54]

6.92981≤  µ  ≤ 8.52588[pic 55]

Por lo que el intervalo pedido para la escolaridad de las mujeres es [6.92981, 8.52588], es decir  la media verdadera  se encuentra en algún lugar entre 6.92981 y 8.52588.

  • Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres.

Inicialmente calculemos un intervalo de confianza para la razón de varianzas si dicho intervalo de confianza contiene a la unidad, realizaremos un intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales, de lo contrario realizaremos un intervalo de confianza para diferencia de medias con varianzas desconocidas pero desiguales

...

Descargar como (para miembros actualizados) txt (13 Kb) pdf (1 Mb) docx (639 Kb)
Leer 8 páginas más »
Disponible sólo en Clubensayos.com