ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

EXTRACCIÓN, TRANSFORMACIÓN Y CARGA DE DATOS (ETL)


Enviado por   •  13 de Febrero de 2023  •  Tareas  •  592 Palabras (3 Páginas)  •  65 Visitas

Página 1 de 3

ACTIVIDAD 2

ACTIVIDAD PRÁCTICA APLICADA

PRESENTADO POR

IVAN ANTONIO RAMIREZ CELEITA

PARA

CAMILO ALFONSO SALAMANCA GUAQUE

EXTRACCIÓN, TRANSFORMACIÓN Y CARGA DE DATOS (ETL)

UNIVERSIDAD UCOMPENSAR

BOGOTÁ 2022

Introducción

En el manejo de los datos siempre se debe considerar la depuración de estos antes de realizar cualquier análisis con estos, ya que se evidencia que los datos pueden venir con muchos errores o datos innecesarios, que al final hacen que el proceso se torne dispendioso para administrar incluso llegar a tener dificultades de entenderlo.

Las reglas o pasos que se han dispuesto al pasar de los tiempos en cuanto al manejo de los datos es importante, ya que nos da un orden una mejor guía de como debemos abarcar en el proceso de transformación de los datos y demás actos que realizamos con estos datos.

El manejo de herramientas para temas de análisis de matemáticas enfocadas en estadísticas, análisis de datos, graficadoras y de capacidad de realizar ecuaciones por medio de comandos o hay sea con un simple botón y todo en un mismo sitio, es de gran ayuda para la persona que necesite dar un reporte detallado de una data cualquiera.

Objetivos

Desarrollar la actividad de forma correcta con la plataforma Matlab y poder comprender como por medio de procesos consecutivos llegamos a un resultado concreto de cualquier base de datos

Justificación

El desarrollo de este trabajo es muy importante ya que nos permitió conocer herramientas para poder ver los datos de otra forma y poder hacer depuración, graficarlos y manipularlos de cualquier forma

MATLAB es una plataforma de programación y cálculo numérico utilizada por millones de ingenieros y científicos para analizar datos, desarrollar algoritmos y crear modelos.

Actividad

  1. Creación del vector con los datos de ejemplo, el vector nos permite mas adelante realizar la grafica

[pic 1]

  1. Creando el plot de los vectores, lo cual nos permite crear la gráfica y ver el comportamiento de los datos  en picos altos y bajos

[pic 2]

  1. Luego realizamos la limpieza de los datos con clean missing, esto para reemplazar los campos NAN de los datos y depuración de datos

[pic 3]

  1. Enseguida rellenamos los valores atípicos de la data

[pic 4][pic 5]

  1. Suavizamos los datos para eliminar el ruido que generan los datos

[pic 6]

  1. Luego localizamos los extremos mínimos y máximos de la data

[pic 7][pic 8]

Conclusiones

Podemos concluir que cada vez hacemos uso de herramientas online para poder mejorar el análisis de los datos, ya sean de empresas grandes o de locales comerciales, pero que cuenten con lo mínimo requerido de una data.

La herramienta Matlab es de gran ayuda, el proceso de aprendizaje es de nivel medio ya que se debe tener conocimientos previos de matemáticas básicas, estadística, base de datos entre otros

Los datos se pueden manipular de muchas formas y esto también es un riesgo a la hora de informar sobre algo en concreto y exacto entonces creo que siempre ahí que seguir los pasos o procesos para tener una data limpia y exacta para cualquier tipo de consulta

...

Descargar como (para miembros actualizados)  txt (4.7 Kb)   pdf (333.5 Kb)   docx (289.1 Kb)  
Leer 2 páginas más »
Disponible sólo en Clubensayos.com