ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Programación exploración de datos


Enviado por   •  25 de Junio de 2023  •  Prácticas o problemas  •  364 Palabras (2 Páginas)  •  92 Visitas

Página 1 de 2

#KAREN LORENA PÉREZ MADERA

#Llamo a la librería readxl y luego importo

library(readxl)

datos <- readxl::read_excel("Educacion Sexual.xlsx")

# 1. Realizar un str, summary del objeto. Comentar brevemente las impresiones obtenidas del df

summary(datos)

# los datos indican que la edad mínima encontrada en el dt es 15 años y la máxima es 19 años, con un promedio de 16 años

# el dt también indica que los años mínimos de educación son 6 años y máximo 12 años con un promedio de 9 años

str(datos)

# la estructura del df tiene 15,157 filas y 6 columnas

# 2. Analizar la informacion faltante con las funciones rowSums y colSums. Comentar brevemente las impresiones obtenidas del df

rowSums(is.na(datos))

# a simple vista se observa que no hay datos na en el df pero por la cantidad de filas es mejor usar colSums

colSums(is.na(datos))

# se evidencia que en las 6 columnas del df no hay datos na

#3. Calcular los promedios y la mediana de cada una de las siguientes variables: Girth, Height, Volume

#Estadística descriptiva mediante paquete "pastecs"

#Cargamos la librería "pastecs"

library(pastecs)

#Promedio

mean(datos$edad)

#El promedio de la variable edad en el df es 16 años

mean(datos$anios_educ)

#El promedio de los años de estudio del df en los datos observados es 8.5 años de educación

#Mediana

median(datos$edad)

#La mediana de la variable edad en el df es de 17 años

median(datos$anios_educ)

#La mediana de la variable años de eduación en el df es de 9 años

#4. Calcular las varianzas y desvios estandares de cada una de las siguientes variables: Girth, Height, Volume

#Varianza

var(datos$edad)

#La varianza de la variable edad en el df es de 1.99

var(datos$anios_educ)

#La varianza de la variable de años de eduación en el df es de 1.38

#Desviación estándar

sd(datos$edad)

# La desviación estándar de la variable edad es 1.41 lo que indica que están lejos de la media

sd(datos$anios_educ)

#La desviación estándar de la cariable años de educación es 1.17 lo que indica que están lejos de la media

#5. Hacer un histograma de cada una de las siguientes variables: Girth, Height, Volume

#Histograma de la variable edad

...

Descargar como (para miembros actualizados)  txt (3 Kb)   pdf (92 Kb)   docx (61 Kb)  
Leer 1 página más »
Disponible sólo en Clubensayos.com