ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Instalación y carga de paquetes necesarios


Enviado por   •  11 de Abril de 2023  •  Tareas  •  25.350 Palabras (102 Páginas)  •  14 Visitas

Página 1 de 102

Reporte Tarea 2

Nombre: Gonzalo Perez - Foster Aburto

Fecha: 25 de Octubre de 2021

Problema : La empresa Salud-Vida necesita un Ingeniero Civil Industrial para solucionar un problema de inteligencia de negocios ellos cuentan con un data set que muestra los resultados de 4.000 pacientes en donde se muestran 20 atributos relativos a s´ıntomas de enfermedades mentales. Los datos son del tipo 0 y 1, indicando con un 1 que posse el atributo y 0 que no lo posee.

Instalacion y carga de paquetes necesarios

Para poder realizar esta tarea se necesitó instalar y cargar paquetes de datos para permitir el correcto analisis de estos datos.

#install.packages("tidyverse")
#install.packages('arulesViz')
library(tidyverse)

library(arulesViz)
library(readxl)

a) 1. Transformar el data set en un data.frame → Lista → Transacción.

Para realizar esta transformación se realizaron diferentes tareas para conocer la naturaleza de la base de datos para posteriormente tomar esos datos y realizar su transformación. A continuación se muestra como se realizaron estos cambios:

#Se carga la base de datos y se conoce su naturaleza
Tarea_RA <- read_excel("C:/Users/foste/Desktop/Inteligencia de Negocios/Tarea 2/Tarea RA.xlsx")
View(Tarea_RA)
datos<-Tarea_RA
datos

## # A tibble: 4,000 x 21
##       Id `Dolor de cabeza` Fiebre Insomnio `Desorden aliment~ `Actividades noct~
##    <dbl>             <dbl>  <dbl>    <dbl>              <dbl>              <dbl>
##  1     1                 0      1        1                  1                  0
##  2     2                 1      1        1                  0                  1
##  3     3                 0      0        0                  0                  0
##  4     4                 0      1        1                  0                  1
##  5     5                 0      1        1                  0                  0
##  6     6                 0      1        1                  1                  1
##  7     7                 0      1        0                  1                  1
##  8     8                 1      1        1                  0                  1
##  9     9                 1      0        1                  1                  0
## 10    10                 1      0        1                  1                  0
## # ... with 3,990 more rows, and 15 more variables: Bipolaridad <dbl>,
## #   Cansancio Generalizado <dbl>, Perdida del disfrute <dbl>,
## #   ánimo irritable <dbl>, falta de energía <dbl>,
## #   Sentimientos de inutilidad <dbl>, Depresion <dbl>, odio a sí mismo  <dbl>,
## #   Sentimiento de culpa. <dbl>, felicidad intensa  <dbl>, mal genio <dbl>,
## #    nerviosismo <dbl>, Frenesí de ideas <dbl>, Locuacidad inusual <dbl>,
## #   Distracción <dbl>

class(datos) # clase del data set

## [1] "tbl_df"     "tbl"        "data.frame"

dim(datos) # Dimension

## [1] 4000   21

nrow(datos) # Cantidad de filas

## [1] 4000

ncol(datos) #Cantidad de columnas

## [1] 21

##Transformar las columnas en filas. Se transforman en las 20 columnas con los nombres de los sintomas en filas.

datos<-gather(data = datos,key ="Sintomas", value = "TieneElSintoma", 2:21)
class(datos)

## [1] "tbl_df"     "tbl"        "data.frame"

dim(datos)

## [1] 80000     3

datos

## # A tibble: 80,000 x 3
##       Id Sintomas        TieneElSintoma
##    <dbl> <chr>                    <dbl>
##  1     1 Dolor de cabeza              0
##  2     2 Dolor de cabeza              1
##  3     3 Dolor de cabeza              0
##  4     4 Dolor de cabeza              0
##  5     5 Dolor de cabeza              0
##  6     6 Dolor de cabeza              0
##  7     7 Dolor de cabeza              0
##  8     8 Dolor de cabeza              1
##  9     9 Dolor de cabeza              1
## 10    10 Dolor de cabeza              1
## # ... with 79,990 more rows

##Ordenar los datos en la columna ID de menor a mayor Ordena todos los ID=1 primero, luego los ID=2, etc.

datos<-arrange(datos, Id)
datos

## # A tibble: 80,000 x 3
##       Id Sintomas               TieneElSintoma
##    <dbl> <chr>                           <dbl>
##  1     1 Dolor de cabeza                     0
##  2     1 Fiebre                              1
##  3     1 Insomnio                            1
##  4     1 Desorden alimenticio                1
##  5     1 Actividades nocturnas               0
##  6     1 Bipolaridad                         1
##  7     1 Cansancio Generalizado              0
##  8     1 Perdida del disfrute                1
##  9     1 ánimo irritable                     1
## 10     1 falta de energía                    0
## # ... with 79,990 more rows

...

Descargar como (para miembros actualizados)  txt (53.1 Kb)   pdf (180.3 Kb)   docx (67.7 Kb)  
Leer 101 páginas más »
Disponible sólo en Clubensayos.com