ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Trabajos de estadísticas.


Enviado por   •  23 de Septiembre de 2015  •  Apuntes  •  1.937 Palabras (8 Páginas)  •  97 Visitas

Página 1 de 8

Trabajo final

González, Agustina- Dutto, Danae

Realizar:

  1. Test de diferencias de medias para comparar dos grupos respecto a alguna variable.
  2. Análisis de Correlación Lineal para las variables Peso y Altura.
  3. relacionar Sexo y Estado civil. Para estado civil dejar dos categorías Soltero y en Pareja (incluir casado).

  1. Test de diferencia de medias:

El objetivo del test a realizar es, ver,  si el  peso medio de los estudiantes según su sexo de la universidad de una cierta carrera es igual.

Estamos bajo las hipótesis:

[pic 1]

[pic 2]

Donde:

 Peso promedio de los alumnos hombres de la Universidad de una cierta carrera.[pic 3]

 Peso promedio de los alumnos mujeres de la Universidad de una cierta carrera.[pic 4]

   El peso promedio de los alumnos hombres y el de las mujeres son iguales.[pic 5]

 El peso promedio de los hombres y las mujeres son distintos.[pic 6]

 

Para  realizar el test, tomar una decisión y dar su conclusión, es necesario elaborar los gráficos en donde la variable cualitativa sexo genera dos muestras: femenino y masculino. A las mismas se las analiza ahora con la variable peso, observando su distribución, la media y la mediana.

Salida de R:

###### Test t para diferencias de medias

> sex=factor(SEXO)

There were 32 warnings (use warnings() to see them)

> peso=PESO

> by(peso,sex,summary)

sex: F

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

     47      51           53         57           63          70

------------------------------------------------------------

sex: M

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

  63.00   68.50   74.00   72.57   77.00   80.00

> peso1=peso[sex=="F"]

> ###### Test t para diferencias de medias

> sex=factor(SEXO)

> peso=PESO

> by(peso,sex,summary)

sex: F

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

     47      51           53            57       63           70

------------------------------------------------------------

sex: M

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

  63.00   68.50   74.00      72.57   77.00   80.00

> peso1=peso[sex=="F"]

> peso2=peso[sex=="M"]

> m1=mean(peso1);m1

[1] 57

> m2=mean(peso2);m2

[1] 72.57143

> boxplot(peso~sex, col=c("grey","cyan"),xlab="Sexo",ylab="Peso", main="Distribución de los alumnos por \n el sexo según su Peso",ylim=c(100,420))

> points(c(m1,m2),lwd=4)

> x11()

> par(mfrow=c(1,2))

> k=5

> h1=(max(peso1)-min(peso1))/k

> histo1=graph.freq(peso1,breaks=min(peso1)+(0:k)*h1,axes=FALSE, right=F,

+   include.lowest = TRUE,frequency=1,xlab="Peso", ylab="numero de alumnos",col="cyan",plot=F)

> histo1=graph.freq(peso1,breaks=min(peso1)+(0:k)*h1,axes=FALSE, right=F,

+   include.lowest = TRUE,frequency=1,ylab="cantidad de alumnos",col="cyan",

+ main="FEMENINO",xlab="Peso")

> axis(1,histo1$breaks)

> axis(2,seq(0,max(histo1$counts),1))

> abline(v = mean(peso[sex=="F"]),   col=1, lty=2, lwd=2) #marca la media en el gráfico.

> abline(v = median(peso[sex=="F"]), col=9, lty=3, lwd=2)#marca la mediana en el gráfico

> k=5

> h2=(max(peso2)-min(peso2))/k

> histo2=graph.freq(peso2,breaks=min(peso2)+(0:k)*h2,axes=FALSE, right=F,

+   include.lowest = TRUE,frequency=1,xlab="Peso", ylab="cantidad de alumnos",col="cyan",plot=F)

>  # breaks=min(variable)+(0:k)*h # realiza un histograma donde los intervalos comienzan del mínimo y realiza k intervalos de longitud h.

> histo2=graph.freq(peso2,breaks=min(peso2)+(0:k)*h2,axes=FALSE, right=F,

+   include.lowest = TRUE,frequency=1,xlab="Peso", ylab="cantidad de alumnos",col="cyan",main="MASCULINO")

> axis(1,histo2$breaks)

> axis(2,seq(0,max(histo2$counts),1))

> abline(v = mean(peso[sex=="M"]),   col=1, lty=2, lwd=2) #marca la media en el gráfico.

> abline(v = median(peso[sex=="M"]), col=9, lty=3, lwd=2)#marca la mediana en el gráfico.

[pic 7]

Analizando los gráficos podemos llegar a pensar que la variable “peso” no tiene distribución normal, sin embargo tenemos que tener en cuenta  el tamaño de la muestra. La  misma no es suficientemente grande para asegurar dicha distribución. Otro recurso que podemos utilizar es el qqplot, que brinda información más certera cuando se tiene una muestra mayor igual a 30 datos.  

Salida del R:

> ##Normalidad gráficamente:

> par(mfrow=c(2,1))

> qqnorm(peso1);qqline(peso1)

> qqnorm(peso2);qqline(peso2)

[pic 8]

Respecto al pensamiento  que las variables no tengan distribución normal, los resultados del test no son confiables, ya que no se estaría cumpliendo con un supuesto del mismo.

 Antes de realizar dicho test siempre hay que fijarse en la distribución que tienen las variables en estudio.

 Se realiza el test, bajo el supuesto que las variables tienen distribución normal.

  Salida del R:

> ###Primero realizar test Dos Varianzas

> var.test(peso~sex)#realiza el test de homogeneidad de varianza

        F test to compare two variances

data:  peso by sex

F = 1.7086, num df = 12, denom df = 6, p-value = 0.5275

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

 0.3184031 6.3702674

sample estimates:

ratio of variances

          1.708629

Decisión: No rechazo la hipótesis nula, ya que la posibilidad de que el estadístico sea mayor a 1.70  y menor a -1.70, dado que es mayor al 5%.[pic 9]

Además, si se cumplen las hipótesis del teorema que relaciona intervalo de confianza y test de hipótesis, podemos observar que: pertenece al intervalo de confianza. Dicho valor está cercano al extremo inferior, por eso el valor de p nos da próximo al 5%.[pic 10]

...

Descargar como (para miembros actualizados)  txt (11 Kb)   pdf (168.4 Kb)   docx (843.9 Kb)  
Leer 7 páginas más »
Disponible sólo en Clubensayos.com