Instalación y carga de paquetes necesarios

Foster Aburto RicoTarea11 de Abril de 2023

25.350 Palabras (102 Páginas)92 Visitas

Página 1 de 102

Reporte Tarea 2

Nombre: Gonzalo Perez - Foster Aburto

Fecha: 25 de Octubre de 2021

Problema : La empresa Salud-Vida necesita un Ingeniero Civil Industrial para solucionar un problema de inteligencia de negocios ellos cuentan con un data set que muestra los resultados de 4.000 pacientes en donde se muestran 20 atributos relativos a s´ıntomas de enfermedades mentales. Los datos son del tipo 0 y 1, indicando con un 1 que posse el atributo y 0 que no lo posee.

Instalacion y carga de paquetes necesarios

Para poder realizar esta tarea se necesitó instalar y cargar paquetes de datos para permitir el correcto analisis de estos datos.

#install.packages("tidyverse")
#install.packages('arulesViz')
library(tidyverse)

library(arulesViz)
library(readxl)

a) 1. Transformar el data set en un data.frame → Lista → Transacción.

Para realizar esta transformación se realizaron diferentes tareas para conocer la naturaleza de la base de datos para posteriormente tomar esos datos y realizar su transformación. A continuación se muestra como se realizaron estos cambios:

#Se carga la base de datos y se conoce su naturaleza
Tarea_RA <- read_excel("C:/Users/foste/Desktop/Inteligencia de Negocios/Tarea 2/Tarea RA.xlsx")
View(Tarea_RA)
datos<-Tarea_RA
datos

## # A tibble: 4,000 x 21
## Id `Dolor de cabeza` Fiebre Insomnio `Desorden aliment~ `Actividades noct~
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 0 1 1 1 0
## 2 2 1 1 1 0 1
## 3 3 0 0 0 0 0
## 4 4 0 1 1 0 1
## 5 5 0 1 1 0 0
## 6 6 0 1 1 1 1
## 7 7 0 1 0 1 1
## 8 8 1 1 1 0 1
## 9 9 1 0 1 1 0
## 10 10 1 0 1 1 0
## # ... with 3,990 more rows, and 15 more variables: Bipolaridad <dbl>,
## # Cansancio Generalizado <dbl>, Perdida del disfrute <dbl>,
## # ánimo irritable <dbl>, falta de energía <dbl>,
## # Sentimientos de inutilidad <dbl>, Depresion <dbl>, odio a sí mismo <dbl>,
## # Sentimiento de culpa. <dbl>, felicidad intensa <dbl>, mal genio <dbl>,
## # nerviosismo <dbl>, Frenesí de ideas <dbl>, Locuacidad inusual <dbl>,
## # Distracción <dbl>

class(datos) # clase del data set

## [1] "tbl_df" "tbl" "data.frame"

dim(datos) # Dimension

## [1] 4000 21

nrow(datos) # Cantidad de filas

## [1] 4000

ncol(datos) #Cantidad de columnas

## [1] 21

##Transformar las columnas en filas. Se transforman en las 20 columnas con los nombres de los sintomas en filas.

datos<-gather(data = datos,key ="Sintomas", value = "TieneElSintoma", 2:21)
class(datos)

## [1] "tbl_df" "tbl" "data.frame"

dim(datos)

## [1] 80000 3

datos

## # A tibble: 80,000 x 3
## Id Sintomas TieneElSintoma
## <dbl> <chr> <dbl>
## 1 1 Dolor de cabeza 0
## 2 2 Dolor de cabeza 1
## 3 3 Dolor de cabeza 0
## 4 4 Dolor de cabeza 0
## 5 5 Dolor de cabeza 0
## 6 6 Dolor de cabeza 0
## 7 7 Dolor de cabeza 0
## 8 8 Dolor de cabeza 1
## 9 9 Dolor de cabeza 1
## 10 10 Dolor de cabeza 1
## # ... with 79,990 more rows

##Ordenar los datos en la columna ID de menor a mayor Ordena todos los ID=1 primero, luego los ID=2, etc.

datos<-arrange(datos, Id)
datos

## # A tibble: 80,000 x 3
## Id Sintomas TieneElSintoma
## <dbl> <chr> <dbl>
## 1 1 Dolor de cabeza 0
## 2 1 Fiebre 1
## 3 1 Insomnio 1
## 4 1 Desorden alimenticio 1
## 5 1 Actividades nocturnas 0
## 6 1 Bipolaridad 1
## 7 1 Cansancio Generalizado 0
## 8 1 Perdida del disfrute 1
## 9 1 ánimo irritable 1
## 10 1 falta de energía 0
## # ... with 79,990 more rows

view(datos)
dim(datos)

## [1] 80000 3

##Filtrar filas. El comando filter act?a en la columna TieneElSintoma, mostrando los valores igual a 1, que corresponde que el usuario si tiene dicho sintoma.

datos<-filter(datos, TieneElSintoma == 1)
datos

## # A tibble: 36,752 x 3
## Id Sintomas TieneElSintoma
## <dbl> <chr> <dbl>
## 1 1 Fiebre 1
## 2 1 Insomnio 1
## 3 1 Desorden alimenticio 1
## 4 1 Bipolaridad 1
## 5 1 Perdida del disfrute 1
## 6 1 ánimo irritable 1
## 7 1 odio a sí mismo 1
## 8 1 nerviosismo 1
## 9 1 Locuacidad inusual 1
## 10 1 Distracción 1
## # ... with 36,742 more rows

dim(datos)

## [1] 36752 3

view(datos)

##Seleccionar columnas. El comando select da a conocer solo las columnas que se desea mostrar, en este caso ID y Sintomas.

datos<-select(datos,Id,Sintomas)
view(datos)
datos

## # A tibble: 36,752 x 2
## Id Sintomas
## <dbl> <chr>
## 1 1 Fiebre
## 2 1 Insomnio
## 3 1 Desorden alimenticio
## 4 1 Bipolaridad
## 5 1 Perdida del disfrute
## 6 1 ánimo irritable
## 7 1 odio a sí mismo
## 8 1 nerviosismo
## 9 1 Locuacidad inusual
## 10 1 Distracción
## # ... with 36,742 more rows

...

Descargar como (para miembros actualizados) txt (53 Kb) pdf (180 Kb) docx (68 Kb)

Leer 101 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com