Taller: Sistemas Inteligentes
Jhon MacanchiTutorial6 de Junio de 2022
4.667 Palabras (19 Páginas)82 Visitas
[pic 1]
Taller: Sistemas Inteligentes
Examen
Nombre: Anita Salinas
Fecha: 19 de diciembre 2021
- Análisis exploratorio de datos
- Comprensión del conjunto de datos.
Para aplicar las técnicas de Machine Learning para aprendizaje supervisado y no supervisado se utilizará un dataset que contiene información de pacientes que ingresaron a UCI en un periodo de tiempo determinado.
El dataset está compuesto por 30 variables y 118 observaciones. Las variables y el tipo de dato de cada una se detallan a continuación:
Nombre de la variable | Descripción | Tipo de dato | nuevo nombre |
ID_patient | Identificador del paciente | int | id |
Nationality | Nacionalidad del paciente | chr | nacionalidad |
DATE OF BIRTH | Fecha de nacimiento del paciente | Chr | fech_nac |
Gender | Indica el género del paciente | Int | genero |
COVID-19 Status | Indica si el paciente es positivo para covid | Int | covid_confirm |
Date of Hospital Admission | Fecha de ingreso al hospital | Chr | fecha_ingreso_hosp |
Date of ICU Admission | Fecha de ingreso a UCI | Chr | fecha_ingreso_uci |
Non Invasive Positive Pressure Ventilation (NIPPV) | Indica si el paciente necesito ventilación mecánica | Int | nippv |
Mechanical Ventilation | Indica si el paciente necesito ventilación mecánica | Int | vent_mecanica |
ECMO | Indica si el paciente necesito ventilación mecánica | Int | ecmo |
HFNC | Indica si el paciente necesito ventilación mecánica | Int | hcfn |
Received tracheostomy | Indica si se le realizó al paciente una traqueostomía | Int | traqueostomia |
Prone-positioning ventilation | Indica si el paciente fue intubado boca abajo | Int | pronacion |
Vasopressors | Medicamento usado en UCI | Int | vasopresor |
TPE | Medicamento usado en UCI | Int | tpe |
Remdesivir | Medicamento usado en UCI | Int | remdesivir |
Hydroxychloroquine | Medicamento usado en UCI | Int | hidroxicloroquina |
Antibacterial agent | Medicamento usado en UCI | Int | trat_antibiotico |
Corticosteroid | Medicamento usado en UCI | Int | corticosteroide |
Interleukin-6 receptor antagonist | Medicamento usado en UCI | Int | interleukin |
Renal Replacement Therapy (Dialysis) in ICU | Indica si el paciente necesitó diálisis | Int | transfusion_renal |
Chronic Cardiovascular-Lung Disease | Antecedentes médicos del paciente | Int | antc_enf_cardiovascular |
Chronic Liver Kidney Disease | Antecedentes médicos del paciente del paciente | Int | antc_rinon_higado |
Diabetes | Antecedentes médicos del paciente | Int | diabetes |
Hypertension | Antecedentes médicos del paciente | Int | hipertension |
Any other Risk Factors or Comorbidities? | Indica si el paciente tiene otros factores de riesgo o no | Int | otro_fact_riesgo |
Risk Factors or Comorbiditie | Fatores de riesgo que tiene el paciente | Char | riesgo_comorbilidad |
ICU Outcome | Indica si el paciente salió de UCI | Int | salida_uci |
Date of Outcome | Fecha de salida de UCI | Char | fecha_salida |
ICU LOS | Indica si el paciente muere o no | int | perdidas_uci |
Primero cambiar el nombre de las variables ya que son demasiado extensos y se dificulta el manejo de estos mediante código R. En la tabla anterior se detalla el nombre con el que se manejaran las variables en el código R.
b. Detectar datos ausentes
Se hace uso de la librería Hmisc el cual contiene la función describe(), que muestra de forma detallada la información que contiene el dataset.
Esta función muestra datos como: número de atributos y observaciones, descripción de cada variable (número de valores faltantes, numero de observaciones que son iguales, media, cuartiles, valor más bajo y más alto de las observaciones) En el Anexo 1 se encuentra la información detallada de cada uno de los atributos.
Mediante la función is.na se puede también verificar la cantidad de valores ausentes en estos atributos.
[pic 2]
c. Identificar hallazgos que puedan ser de interés para la institución de salud.
Para poder interpretar los valores de cada uno de los atributos se detalla a continuación el significado de cada uno de los valores.
nuevo nombre | Significado |
genero | 1 = hombres 0 = mujeres |
covid_confirm | 1 = positivo 0 = negativo |
nippv | 1 = si 0 = no |
vent_mecanica | 1 = si 0 = no |
ecmo | 1 = si 0 = no |
hcfn | 1 = si 0 = no |
traqueostomia | 1 = si 0 = no |
pronacion | 1 = si 0 = no |
vasopresor | 1 = si 0 = no |
tpe | 1 = si 0 = no |
remdesivir | 1 = si 0 = no |
hidroxicloroquina | 1 = si 0 = no |
trat_antibiotico | 1 = si 0 = no |
corticosteroide | 1 = si 0 = no |
interleukin | 1 = si 0 = no |
transfusion_renal | 1 = si 0 = no |
antc_enf_cardiovascular | 1 = si 0 = no |
antc_rinon_higado | 1 = si 0 = no |
diabetes | 1 = si 0 = no |
hipertension | 1 = si 0 = no |
otro_fact_riesgo | 1 = si 0 = no |
salida_uci | 1 = si 0 = no |
...